Flux
Что за сервис FLUX?
FLUX.1 – набор моделей с открытым исходным кодом для преобразования текста в изображение от компании Black Forest Lab. В составе команды заявлены специалисты с выдающимся послужным списком в сфере разработок ИИ. Среди проектов, в которых принимали участие сотрудники Black Forest Lab – Stable Diffusion. Конкурента, судя по отзывам, FLUX.1 обошел и уровнем детализации изображений, и «послушностью» следования запросу, и разнообразием стилей.
Для каких профессий подходит сервис FLUX?
Дизайнеры и иллюстраторы получают возможность экспериментировать со стилями, текстурой, цветом, концепцией. Могут тестировать визуальный продукт, создавать прототипы.
Разработчики игрового контента находят в моделях инструмент генерации персонажей, предметов и сцен. Используют его для раскадровки, концептуальной визуализации, интеграции идей в проект.
Маркетологи и рекламщики применяют ИИ-продукт для брендирования, разработки рекламных кампаний и создания визуальных стимулов, которые привлекают внимание и клиентов.
Блогеры и контент-мейкеры с помощью FLUX создают оригинальный визуальный контент, чтобы выделиться на фоне конкурентов, увеличить количество и вовлеченность подписчиков.
FLUX – универсальный инструмент, которому каждый может найти применение, ведь создание произведений AI-искусства укрепляет «мускул творчества». Проявляя свои творческие способности, мы развиваем нейронные связи, стимулируя работу мышления. Таким образом, искусственный интеллект помогает интеллекту естественному, повышая его объем, «архитектуру» и ресурс.
Ключевые функции сервиса FLUX
- Генерация уникальных изображений на основе текстовых описаний.
- Обращает внимание на все слова и качественно синтезирует промпт.
- Точно генерирует текст в большем, чем SD-3, диапазоне (6-8 слов).
- Можно использовать для создания логотипов, шрифтов и баннеров.
Цены и условия использования сервиса FLUX
FLUX.1 выпускается в трех вариантах: [pro], [dev] и [schnell]. Технические подробности об архитектуре, производительности, методе обучения и других деталях есть на сайте компании. Для разработки моделей стартап привлек финансирование в размере $31 млн, что положительно отразилось на результате.
- FLUX.1 [pro] – «лучшее из FLUX.1» по заявлению разработчиков. Модель предлагает самую мощную производительность с высочайшим уровнем скорости, качества и детализации изображений. Доступна через API, на Replicate и fal.ai. Стоимость генерации изображения – примерно $0,05.
- FLUX.1 [dev] – открытая модель, которую можно скачать на Hugging Face и запустить на своем компьютере. Разработана на базе версии [pro]. Выдает схожее с [pro] качество и возможности. Попробовать можно на Replicate ($0,03) и fal.ai ($0,025).
- FLUX.1 [schnell] – самая быстрая и легкая модель. Находится в открытом доступе под лицензией Apache 2.0. Предназначена для личного использования. Доступна на Hugging Face и GitHub. Есть интеграция с ComfyUI.
Разработчики утверждают, что модели задают новый стандарт визуального качества, следования запросу и вариативности параметров, превосходя Midjourney V6, DALL-E 3 и SD3. В планах компании запуск модели генерации видео, которая тоже претендует на звание лучшей.
Преимущества сервиса FLUX
- Высокое качество, детализация и стилизация изображений.
- Поддержка разных визуальных направлений и разрешений.
- Нейросеть хорошо синтезирует длинные и сложные описания.
- Отлично работает с текстом – шрифтами, цветом, освещением.
- В семействе есть модели open source (с открытым исходным кодом).
- Доступна бесплатная версия («schnell») – попробовать можно тут.
Недостатки сервиса FLUX
- Модель «тяжелая» при установке на компьютер (для запуска рекомендовано иметь 24 ГБ видеопамяти).
- По параметру эстетической привлекательности уступает Midjourney (по мнению пользователей).
Чем FLUX отличается от конкурентов
При всех прочих равных с небольшой доработкой модель претендует выбиться в лидеры и отодвинуть топовых конкурентов на задний план. Уже сегодня качеством генерации FLUX обошла третью версию Stable Diffusion, которая вызвала много споров и критики, а по параметру реалистичности и эстетичности вплотную подошла к Midjourney 6.
Отзывы о сервисе FLUX
Сергей: «Генератор изображений с открытым исходным кодом, который не уступает Midjourney. У Flux лучше текст и анатомия. Генерация занимает 10-15 секунд».
Кирилл: «Детализация неожиданно высокая. Руки почти всегда в порядке. Нет слишком жесткой цензуры на содержание текстовых описаний».
Мария: «Кажется, обошла Stable Diffusion и Midjourney. Великолепно работает с надписями, но, увы, лишь на английском языке».
Вопросы и ответы о сервисе FLUX
Как начать работу с сервисом FLUX?
Зайти на официальный сайт, выбрать подходящую версию, перейти по ссылке и начать процесс генерации.
Как пользоваться FLUX бесплатно?
Модель с открытым исходным кодом можно загрузить на компьютер или попробовать тест-версию «schnell».
Можно использовать в коммерческих целях?
Для применения в коммерческих целях разработчики просят связаться с компанией через корпоративную почту flux@blackforestlabs.ai.
Выводы
Модель заслуживает внимания, ведь уже в первой версии FLUX «наступает на пятки» топовым генераторам text-to-image, удивляя высокой детализацией, «послушностью» и качеством стилизации. После нескольких обновлений модель серьезно улучшится и будет конкурировать с Midjourney на равных. Компания планирует выйти на рынок генерации видео и уже анонсировала выпуск модели text-to-video под названием SOTA.