Держите новость с отечественных фронтов ИИ-разработок — к нам подъехала YandexART 2.5. Рисует так, что Midjourney уходит в отставку 🎨. В Яндексе отчитались: качество выросло, стала послушнее, реализм — будто снято на телефон. Еще и надписи в картинки вписывает — правда, лишь на латинице, но сидят как влитые 🔠. В общем, эстеты, любители реализма и каждый, кому надоел разброд и шатание в буквах на сгенерированных изображениях — встречаем обнову.

Фото: «Яндекс»

Начнем с внутренних тестов. Модель прогнали через два этапа проверки — слепые попарные сравнения людьми 👀 (те самые Side-by-Side или SBS) и объективную машинную оценку 🤖 (VLM). По результатам YandexART 2.5 не только лучше своей предшественницы 2.0, но и обходит Midjourney 6.1 по всем параметрам 🏆, а с DALL-E, Ideogram и Flux либо идет на равных, либо их обгоняет. Если вспомнить, что недавно Midjourney была недосягаемым эталоном визуального качества, результат впечатляет. Накрутили или нет — другой вопрос, ответ на который получим от «внешних» независимых тестировщиков 🤔.

Победы YandexART 2.5 согласно внутренним тестам. Зеленым выделены успехи модели в сравнении с конкурентными нейросетями и ее предыдущей версией. Фото: ya.ru

В Яндекс отметили, выдающиеся результаты новой нейронки — результат ее обучения. Датасет был огромным — почти миллиард изображений с подробными описаниями, которые подготовила специально обученная модель. Собственно, по этой причине генерации в YandexART 2.5 максимально релевантны (соответствуют) промпту — будь то «кот в шляпе верхом на единороге» 🐱 или «пингвин, пьющий воду из кокоса под пальмой на пляже» 🥥. Кстати, сама подбирает стиль. Например, логотипы делает «чистыми» и лаконичными, иллюстрации к детским книгам — мультяшными, яркими и веселыми.

Новая модель лучше следует промпту: точное количество мармеладных мишек, правильные цвета, более подходящая форма. Фото: «Яндекс»

Внедрили 16-канальный автокодировщик VAE (было 4): это повысило качество реализации мелких деталей — без каши на сложных текстурах, четкие контуры и т.д. Использовали fine-tuning с супированием 🔧: если просто — сделали несколько версий модели и объединили в одну, взяв от каждой самое лучшее. Ускорили генерацию: в YandexART 2.0 движок работал уже в 4 раза быстрее, теперь — в 9 ⚡. Без потери качества, разумеется.

В итоге YandexART 2.5 лучше следует инструкциям в текстовых описаниях, меньше «фантазирует», быстрее работает 🚀. В детализации и генерации текста рвет конкурентов. Ну и фотореализм.

Фото: «Яндекс»

Обычную версию можно потрогать в «Шедевруме» и в чате с Алисой. Это бесплатно. Кроме обычной, есть мощная Pro с реализмом на максималках. Тоже лежит на «Шедевруме», но уже для «шедевральных» подписчиков (7 дней бесплатно 🎁, далее — 100 рублей ежемесячно). Подписчики первыми тестируют новые фичи, апскейлят картинки до 4K, скачивают без watermark и могут использовать результат генераций в своих «корыстных», то есть коммерческих целях. Go пробовать 🚀!