Приветствуем 👋! Неторопливо выкатываемся из-за столов в новый год. Для скорости есть нейросети 🤖. В 2024-м столько всего нагенерили, что можно еще целый год разбирать. Если коротко – стали умнее 🧠. «Камо грядеши?». Скоро, наверное, будем не промпты писать нейросетям, а просто думать в их сторону 💭. Поговорим об основных достижениях года – контекстах, агентах и медицине. Пробежимся о главном за неделю – у Grok появился свой сайт, а Kling улучшился на 195% 📈. Непонятно, кто и чем замерял, но у маркетологов свое представление о прекрасном. Как обычно, плюс 10 нейросетей в копилку в конце рассылки – расширяем ИИ-кругозор.
Содержание
📰 Новости из мира ИИ и нейросетей
Google: запустила Agentspace 🚀. Это мультимодальный агент, который комбинирует интеллект Gemini с поисковым потенциалом Google, чтобы быть источником быстрой корпоративной информации для компаний. Умеет «копаться» в хранилищах рабочих систем, оперативно выкатывать данные, давать рекомендации и даже предпринимать какие-то действия. Фирменный гугловский стиль, мультиязычность, минимальное кодирование – все для счастья и продуктивности сотрудников 💼.
Microsoft: накануне новогодних праздников попыталась улучшить Bing Image Creator, внедрив на сервис обновленный DALL-E 3 под кодовым названием PR16. Компания обещала удвоить скорость и повысить качество. Не получилось. Результат вызвал шквал жалоб на X и Reddit. Пользователи сказали – стало хуже 😡. Реакция была настолько негативной, что Microsoft решила вернуть предыдущую версию PR13 🔄.
DeepSeek: Китай жжет напалмом США 🔥. Пока индустрию ИИ. Еще один искусственный интеллект из Поднебесной порвал бенчмарки. Нейронка DeepSeek V3 подвинула OpenAI и Anthropik. Вложили в нее копейки – $5,5 миллионов. На ChatGPT-4 ушло в десятки раз больше. Заявленные возможности DeepSeek V3 не уступают флагманским моделям. При этом нейросеть опенсорсная.
Kling: обновился до версии 1.6 и улучшился на 195%. Это генератор 5-секундных видеороликов из текстовых подсказок. И снова китайская сборка. Обновление было направлено, в основном, на повышение точности понимания и соблюдения промптов 🎯. Доступны два режима генерации: стандартный и pro с широкой панелью настроек.
Grok: теперь не только на X, но и в вебе. Чат-бот уже не привязан к социальной сети. Завел себе сайт и стал автономным. Говорят, что такой же честный и дерзкий. Правда, на сайте пока висит надпись «Coming soon» ⏳. «В интернетах» пишут, что будут обновы. Ждем.
👉 Больше новостей – в нашей ленте!
🏆 Главные ИИ-достижения 2024 года
🎯 ИИ-помощники и агенты
Автоматизация рутины на рабочих местах стала реальностью. В 2024 году AI-ассистенты взяли на себя задачи, которые раньше были «пожирателями времени». Главным героем этой истории стал, конечно же, Copilot (Microsoft). Его интеграция с рабочими экосистемами была настолько популярной, что 70% компаний из списка Fortune 500 сказали: «Берем, заверните, пожалуйста».
Microsoft был не единственным игроком на рынке «помощников» и «агентов». Google выкатил Vertex AI Agent Builder в апреле и Agentspace в декабре (уже говорили о нем). Salesforce запустил собственных ИИ-агентов в августе для CRM. Oracle подключился в сентябре, добавив истории корпоративного пафоса. В итоге, в 2024 году офис стал местом, где появилось свободное время 🕒.
В 2025-м, по прогнозам Forbes, ИИ-помощники уютно устроятся в наших домах. Будут помогать нам бронировать столики и билеты 💳, оплачивать коммунальные, заниматься другой веб-рутиной. Вопрос лишь в одном – как быстро мы сдадим полномочия и начнем делегировать личное искусственному интеллекту.
🎯 Генерация видео и аудио
Пережила шок и трепет творческая индустрия 🎬. Аудио и видеогенераторы стали почти студийного качества. Отметим, конечно, безусловного лидера Runway Gen-3 Alpha – компания, на минуточку, заключила партнерство с Lionsgate для интеграции своих моделей в процесс создания фильмов 🎥.
Сентябрь подарил нам MiniMax, удививший и скоростью работы, и качеством. Последний месяц года разорвал, залпом релизнув на рынок: долгожданную Sora от OpenAI с фокусом на кинематографичность, Google VEO 2 с улучшенной глубиной цвета и света и Luma Dream Machine 1.5, которая «делает ваши мечты осязаемыми».
Что касается аудио, самую громкую волну вызвал Suno V4, который в ноябре научился генерировать полноценные песни – с вокалом, инструментами, эмоциями. Это уже не просто музыка для фона, а треки с претензией на чарты Spotify 🎧.
🎯 Понимание контекста
В 2024-м нейросети сильно добавили по части контекстного понимания 🧠. Того самого, что превращает диалог с ИИ из «вопрос-ответ» во что-то похожее на человеческое общение. Это был год, когда машины перестали быть «решалками» и «отвечалками» и примерили на себя роль «партнеров» 🤝. К чему это приведет, увидим в ближайшее время.
К примеру, Claude 3, появившийся в марте, стал меньше ошибаться в сложных задачах и лучше удерживать нить разговора. GPT-4o и GPT-o1 сделали семимильный шаг вперед в «рассуждениях». Ни от кого не отстал и Google – декабрьский апдейт Gemini до версии 2.0 добавил глубины в аналитику.
🎯 Медицина и здоровье
Глаза боятся, а руки делают. Примерно так можно описать настроение при внедрении нейросетей в одну из самых чувствительных зон – медицину 🏥. Врачи стали использовать Apple Vision Pro в малоинвазивных операциях, надев гарнитуру. AlphaFold от DeepMind «предсказывает» взаимодействие молекул – полезная фича при разработке лекарств и изучении механизмов болезней 💊.
Искусственный интеллект помогает анализировать биопсию, изучать маммографию, рассматривать МРТ и КТ. Не только в лабораториях и больницах. Наш «Сбер» разработал кольцо с искусственным интеллектом. GigaChat под капотом. Следит за здоровьем, изучая качество сна, количество сердечных сокращений и другие параметры.
🔥 10 новых платформ с ИИ
🛠️ Molypix: чемоданчик с инструментами для создания красивых профессиональных дизайнов (логотипы, шапки постов, открытки, объявления). Все базовые опции бесплатные. Данные банковской карты не нужны.
🌐 Durable: сайт за пару минут. Когда нужно без специальных навыков и большого бюджета пульнуть свой бизнес в интернет. К платформе прикручен генератор текстов. Есть возможность законнектиться с маркетинговыми и аналитическими сервисами.
🏠 REimagine Home: еще про дизайн. На этот раз под прицелом искусственного интеллекта – комнаты. Платформа позволяет загружать фотографии помещений и мгновенно преобразовывать их с помощью новых стилей, декора и мебели.
🎥 Fliki: простой в использовании генератор текст-видео. На выходе не кино, как в Sora. Fliki преобразует статьи и другие материалы в несложное видео (например, говорящий аватар) с реалистичной озвучкой.
📚 PaperBrain: поможет найти релевантные научные статьи. Здесь можно создавать и обмениваться исследовательскими работами. Удобный интерфейс для загрузки и редактирования.
📄 Humata: помогает извлекать и анализировать информацию из PDF-файлов, научных статей, отчетов и других текстовых материалов. Можно задавать вопросы по содержимому документов.
🔍 Andi: интеллектуальный поисковый движок. Что-то среднее между чат-ботом и гуглом. Вместо ссылок выдает краткие сводки и визуал. Поддерживает диалог для углубления и уточнения поиска.
📊 Browse: платформа для сбора информации с сайтов. Пригодится аналитикам, маркетологам, e-commerce и стартапам. Запускаете робота и получаете данные. Есть 200+ готовых натренированных ботов, если хотите без кодинга.
📈 Tome: ИИ-ассистент для продаж. Обратите внимание на генератор презентаций. А вообще с помощью Tome можно анализировать финансы, стратегии, взаимодействие с клиентами и партнерами.
🌙 Dream Interpreter: куда в наше сложное время без расшифровщика снов. Разработчики пишут, что материалы генерируются на основе современных воззрений о подсознании и его символических образах.
До встречи на следующей неделе🖐️!