Нейросеть Kandinsky - генератор изображений из текстовых описаний и картинок
Что умеет: Kandinsky – мультимодальная платформа для генерации картинок и видео. История нейросети началась в 2022 году. Пройдя через серию обновлений и улучшений, включая релизы 2.0 и 3.0, Kandinsky в модальности text-to-image вышел на уровень 3.1. Это принципиально новое качество картинки и более богатый ассортимент настроек.
Нейросеть Kandinsky 3.1 дообучена на большом эстетичном датасете. Изображения, которые она создает, стали более яркими, сочными и реалистичными. Скорость генерации увеличилась в десять раз. Качество достигло разрешения 4K. Модель сама улучшает промпты за счет интеграции с Neural-Chat-v3-1 – можно писать, как удобно, и не думать о промпт-инжиниринге.
Кроме текста, принимает на входе картинки – редактирует их, миксует, меняет стиль, добавляет другие объекты. «Текст + картинка» тоже можно залить. Kandinsky смешает и сделает все красиво. Есть пресеты стилей и разные соотношения сторон.
Доступ: бесплатно.
Нужно ли использовать VPN: нет.
Поддержка русского языка: да.
На каких платформах работает: на платформе fusionbrain.ai, в Telegram, мобильном приложении Сбербанк Онлайн, код на GitHub.
ТОП-3 фишек:
- хорошо понимает русский (язык и менталитет);
- функция улучшения промпта («бьютификация»);
- inpainting/outpainting – редактирует части картинки.
ТОП-3 применений:
- Дизайн. Kandinsky предлагает дизайнерам и художникам новый подход для экспериментов с формой, цветом, стилем и композицией. Напишите словами, что нужно, или залейте референс. Дальше нейронка сделает все сама. И не нужно вручную или в программах тратить на это часы.
- Реклама. Стоимость рекламного визуального материала может равняться нулю (вместо миллионов). Упаковка, афиша, плакат, объявление – с нейросетью Kandinsky все быстро, бесплатно и цепляет внимание.
- Блогинг. Социальные сети давно пересели на рельсы нейросетей. Многие нашли идеального партнера в Кандинском. Генерирует обложки для постов, картинки для Stories, анимацию для роликов Reels. Замечательно понимает русский и не надо танцев с бубнами при оплате.
Что понравилось: Достойный продукт отечественной сборки. Доступен всем и каждому за бесплатно. Хорошо работает «миксер» – если залить на вход картинку и смешать ее с другой или текстом, получится симпатично.
Простой интерфейс. Снизу – поле для ввода промпта. Там же выбор стиля – «цифровое фото», «хохлома», «аниме» и т.д. Сверху – кнопки дополнительных функций (ластик для стирания части, очистка холста, формат и т.д.).
Генерирует 1-2 минуты. Примерно как все. Иногда получается шедеврально – с реализмом на максималках, но «мимо» с нейросетью Kandinsky случается тоже. И чаще, чем нам бы хотелось. Спасибо за inpainting. Редактировать часть картинки это удобно.
Что не понравилось: Может генерировать «уродцев». Проблемы с лицами, руками, ногами – явление частое. Люди, в целом, не сильная сторона нейросети Kandinsky. Что касается промптов: несмотря на интеграцию с языковой моделью, которая, по обещаниям, из любого текста сделает «конфетку» – нет, не сделает. И надо стараться выражать свою мысль согласно канонам: объект, описание, действие, детали, передний план и задний фон, освещение.
Из приятного – можно писать на русском. Английский понимает. Но даже самый канонический промпт не гарантирует ничего. Котики получаются замечательные. Лица в анфас – удивительной красоты. Но как только промпт выходит за рамки монументальных поз и сольных визуальных партий, Кандинского начинает нести. «Гладить кота» при всей простоте сюжета – едва выполнимая для Kandinsky задача.
Оценка редакции:
Простота использования: 4,8/5
Точность и надежность: 4,2/5
Настройки и гибкость: 4,7/5
Функциональность: 4,4/5
Производительность: 4,7/5
Общая оценка сервиса: 4,5/5
Примеры работ: