Парни из Black Forest Labs обновили свой генератор изображений. Вышла в люди Flux 1.1 в версии pro, и есть на что посмотреть. Из интересного – в 6 раз быстрее, чем предыдущая pro-шка Flux 1.0. Лучше по качеству генерации и следованию промпту. На бенчмарках под тестовым названием «Blueberry» обошла конкурентов (Ideogram, Midjourney, DALLE-3), получив высший балл Elo. Вот так выглядят метрики с сайта artificialanalysis.ai (по состоянию на 1 октября 2024 года).
Отметим, что в этой таблице нейронка Stable Diffusion 3 Medium расположилась на последнем месте. Доверять бенчмаркам или нет – вопрос открытый. Разработчики и программисты их любят. Мол, «мы тут измерили и выяснили». Но реальное мнение о нейросетях в итоге оставляют не графики, а пользователи. Хотя бы потому, что бенчмарки зачастую проводят с пристрастием. Если кому-то очень хочется доказать, что какой-то продукт лучше прочих, он создаст для этого все условия. И хотя тест Elo как будто бы сторонний, знаем мы эти «независимые исследования».
И все же вернемся к тому, что представили нам в релизе. Итак, время отклика сократили, а визуальную точность повысили. Генератор лучше обрабатывает сложные промпты, выдавая более релевантные и реалистичные результаты. В одном из тестов Flux 1.1 Pro сгенерировала длинный текст на картинке, что всегда слабое место для нейросетей. Результат получился разборчивый, с приятным шрифтом. Да, нейронка допустила ошибку, два раза повторив в предложении слово «тест», но все равно прилично выглядит.
Пишут, что быстрый генератор изображений сверхвысокого разрешения скоро появится в API. Модель можно будет настроить под себя и использовать в своих приложениях. За деньги, конечно. Но цены демократичные: 4 цента за изображение (в Flux 1.0 Pro было 5 центов). Нейронка также будет доступна на платформах партнеров – Replicate, fal.ai и Freepik. Пользуйтесь, где хотите.
А на горизонте маячит генератор из текста в видео. Ребята из Black Forest Labs уже работают в этом направлении. Для укрепления позиций в нише генеративных ИИ без видеогенераторов, кажется, ни один игрок этого рынка не обойдется. В кулуарах говорят, что и Midjourney туда же – тоже втихую занимаются разработкой подобной модели. Ну а мы пока тестируем рассекреченную «Blueberry» и делимся беспристрастным мнением в комментариях.