Приветствуем 👋! Илон Маск планирует колонизировать Марс 🚀. С искусственным интеллектом такое возможно. Красные пески, купольные станции, роботы, что подносят кофе ☕ и кислород. Но представьте: один из них вдруг решает, что люди ему не указ. Слишком уж автономный. Кофе теперь — себе. Кислород — по талонам.
Содержание
Спускаемся с небес, то есть Марса, на землю и видим: полномочия у ИИ становятся шире. Конечно, приятно за минуту сделать пачку портретов без фотошопа с InfiniteYou, но где граница между удобством и потерей контроля? Об этом и не только — в рассылке 👉.
📰 Дайджест главных событий недели
🎨 OpenAI: представила функцию нативной генерации изображений в GPT-4o. Фактически заменила Dall-E, который, согласно отчетам Poe, упал на «дно». Теперь на платформе ChatGPT станет лучше. GPT-4o генерирует и редактирует картинки прямо в чате. Доступен для всех. Скоро в Sora.
🧠 Google: выкатил «самую умную» модель Gemini 2.5 Pro. Пополнил мировую коллекцию «рассуждающих» нейросетей, которые сначала «думают», а потом отвечают. Модель лидирует на LMArena. Обошла всех в бенчах GPQA и AIME. Показала выдающийся результат в «Последнем экзамене человечества».
✉️ Gmail: жизнь пользователей приложения для работы с электронной почтой станет легче. Добавили в поиск режим «наиболее релевантный». Больше не нужно копаться в хаосе писем. Попросите ИИ разобраться, где находится нужное.
👀 Gemini: научился «видеть» в режиме Live. Google добавил своему ассистенту опцию «зрения». Будет чекать экран и смотреть на мир через камеру. Да, наконец, развернули часть опций «Project Astra». Не прошло и года.
🤔 Copilot: компания Microsoft анонсировала запуск целых двух «рассуждающих» агентов, Researcher и Analyst, в составе Microsoft 365 Copilot. Занимаются тем же, что и другие агенты: анализируют, делают выводы. Researcher ориентирован на масштабные исследования, Analyst — на решение сложных проблем.
👉 Больше новостей — в нашей ленте.
📸 Портрет без фотошопа с InfiniteYou
ByteDance релизнула нейроинструмент для создания реалистичных изображений с вашим «фейсом» InfiniteYou. Помещайте себя в любой сетап — скафандр космонавта, костюм дипломата, доспехи средневекового рыцаря. Программа нативно объединит сюжет и лицо. Без ощущения, что криво приклеили портрет на болванку.
Под капотом — движок типа FLUX. Это значит: почти нет цензуры. Спецмодуль InfuseNet впечатает черты лица в любой сюжет, потому что ваше тело — ваше дело. Реализм, анатомия, детализация — максимальные. Выжали из современных gen мощностей все, что можно было. Хотите попробовать — идите сюда:
💡 Чек-лист, как использовать демо:
📌 Загрузите фото лица (ID-изображение): крупное, без теней, блюра и перекрытия.
📌 Введите промпт: опишите, какое фото хотите увидеть в итоге, и выберите модель.
📌 Опционально: загрузите контрольное фото (можно чужое) для понимания позы.
📌 Опционально: настройте расширенные параметры генерации (Advanced, LoRAs).
📌 Жмите Generate, ждите результат и наслаждайтесь эксклюзивной версией себя.
🛑 Как защитить себя от агентов ИИ
Технологии зашли далеко. Даже слишком. Взять, к примеру, агентный ИИ — системы на базе нейросетей, которые делают нашу жизнь как будто бы проще. Занимаются всякой рутиной — шопятся в интернете 🛒, разбирают завалы почты, планируют встречи 📅. Ты ему промпт, он тебе — результат.
Удобно? Очень. Как обычно, есть но. Сотрудники HuggingFace, Margaret Mitchell с коллегами, раскатали большую статью на MIT Technology Review о рисках передачи контроля «агентам» 📑. Как бы нам ни хотелось жить в мире, где искусственный интеллект делает все вместо нас, полная автономия ИИ, к которой прут напролом разработчики — худшее из решений.
В отличие от чат-ботов, ограниченных интерфейсом (одним), ИИ-агент — мультизадачник с широким доступом ко всему. Может ли он ошибаться? Как любой искусственный интеллект — да, конечно. Сделал ошибку при банковском переводе — минус на счете 💸. Случайно отправил ваш секстинг с подругой в рабочий чат — конфуз. Масштабируем: агент по управлению финансами страны переводит бюджет в офшор. ИИ, управляющий военной системой, нажимает «красную кнопку» 🔴.
Идея с автономностью ИИ-агентов — крутая, но слишком опасная. Мы должны защищать свое право быть хозяином ситуации. Контролировать, проверять, понимать, как работают эти штуки 🔒. Авторы вспоминают, как в 1980 году компьютерные системы ошибочно сообщили, что на Америку летят 2000 советских ракет. Это могло привести к мировой катастрофе, если бы люди не проверили информацию. Вовремя. Наглядный пример, как важен контроль.
Hugging Face разрабатывает smolagents — платформу для создания изолированных сред («песочниц») для разработки ИИ-агентов 🔒. Безопасные рамки для тестов, где все шаги — прозрачные 🧐, а ошибки не критичные. Подход диаметрально противоположный тому, чем занимаются другие (типа OpenAI), создавая «черные ящики» для ИИ.
💡 Мы, конечно, за прогресс и все такое, но только при условии — все под контролем.
🔥 10 новых платформ с нейросетями
📝 Conveo: «умная» модерация интервью. Платформа анализирует сотни аудио и видео одновременно, генерируя ценные для бизнеса и исследований инсайты. Искусственный интеллект, кроме слов, «сканирует» мимику и эмоции, делая тайное явным.
⚙️ Consolex: 100+ ИИ-инструментов в одном рабочем пространстве. Хаб, где есть, кажется, все мейнстримные LLM, от Flux до Notion. Удобная экосистема для ведения ваших проектов — анализа данных, генерации кода, творчества и т.д.
🎥 Clipchamp: редактор видео с искусственным интеллектом. Переходы, фильтры, субтитры на 80+ языках. Text-to-speech – превращает текст в речь для озвучки. Все базовые опции бесплатно. Есть premium для тех, кто любит без watermark.
📷 Picsman: еще одна нейросеть (много не мало!) для «умной» обработки фотографий. Меняйте фон, стирайте ластиком лишнее, улучшайте масштаб и качество. Тысячи шаблонов для бизнеса, e-commerce и социальных сетей.
📄 Collate: бесплатное приложение для macOS. Выжимает из PDF самую суть (краткие саммари), ищет по содержанию, создает, если нужно, закладки. Все функции доступны локально (офлайн). Ваши файлы никуда не «сливаются».
📐 Photomath: использует камеру вашего смартфона для решения математических задач. Сканируете «проблему», от арифметики до интегралов, и получаете, кроме ответа, step-by-step объяснения, как пошагово выйти на результат.
📜 Kickresume: генерирует резюме, сопроводительные письма, карьерные карты и сайты-визитки. 2000+ готовых образцов — бери, кастомизируй, пользуйся. ATS-friendly — сгенерированные документы проходят через фильтры и попадают в руки рекрутеров.
📂 Presenti: создает презентации из текстовых файлов. Есть авто режим: выбираете тему, а система сама подбирает и дизайн, и контент. Библиотека красивых шаблонов, функция редактирования, бесплатный старт.
✍️ Aithor: ассистент для студентов, писателей и ученых. Помогает с контентом: писать, цитаты, списки. Есть инструменты для проверки грамматики, перефразирования и улучшения читабельности работ.
🚀 Mixo: превращает идею в работающий стартап. Опишите концепцию, и Mixo сделает сайт со всеми примочками: лендингом, логотипом и текстами. Отличное решение для быстрого запуска, бета-тестов и создания waiting-листов.
На сегодня все. До встречи на следующей неделе🖐️!