Найти в Дзене
Psy Eyes

Black Forest Labs: выпустили Flux 2 Flux.1 Kontext — набор flow matching моделей для генерации и редактирования изображений

Black Forest Labs: выпустили Flux 2 Flux.1 Kontext — набор flow matching моделей для генерации и редактирования изображений. Конкурент ChatGPT и других нейронок для внесения изменений в картинки текстом. В отличие от традиционных text-2-image моделей, Kontext принимает на вход и текст и картинку, позволяя вносить изменения точно следуя контексту. Чем Kontext выделяется: * Стабильные персонажи и элементы в разных сценах * Консистентность персонажей сохраняется сквозь итерации * Редактирование частей изображения, не меняя всю сцену * Генерация сцен в нужном стиле по рефу * Высокая скорость для интерактивной работы 3 варианта моделей: * FLUX.1 Kontext [pro]: основывается на предыдущих правках, сохраняя при этом персонажей, личности, и стили в разных сценах. * FLUX.1 Kontext [max]: максимальная производительность с улучшенным следованием промту, стабильностью персонажей, и обработкой текста. * FLUX.1 Kontext [dev]: опенсорсный 12B вариант самой развитой модели (вероятно Pro). Max и

Black Forest Labs: выпустили Flux 2 Flux.1 Kontext — набор flow matching моделей для генерации и редактирования изображений. Конкурент ChatGPT и других нейронок для внесения изменений в картинки текстом.

В отличие от традиционных text-2-image моделей, Kontext принимает на вход и текст и картинку, позволяя вносить изменения точно следуя контексту.

Чем Kontext выделяется:

* Стабильные персонажи и элементы в разных сценах

* Консистентность персонажей сохраняется сквозь итерации

* Редактирование частей изображения, не меняя всю сцену

* Генерация сцен в нужном стиле по рефу

* Высокая скорость для интерактивной работы

3 варианта моделей:

* FLUX.1 Kontext [pro]: основывается на предыдущих правках, сохраняя при этом персонажей, личности, и стили в разных сценах.

* FLUX.1 Kontext [max]: максимальная производительность с улучшенным следованием промту, стабильностью персонажей, и обработкой текста.

* FLUX.1 Kontext [dev]: опенсорсный 12B вариант самой развитой модели (вероятно Pro).

Max и Pro доступны через API BFL, платформы а-ля Krea, Freepik, Lightricks, OpenArt, LeonardoA, или облачных партнёров FAL, Replicate, Runware, DataCrunch, и TogetherAI.

Стоит выделить отдельно ComfyOrg, которые здесь тоже как облачный провайдер выступают. Поддержка Kontext уже добавлена в последнюю версию Comfy (как десктопную так и портативную). Воркфлоу у них в анонсе, а цена на генерации указана на сайте: 1 картинка стоит $0,08 для обоих моделей Pro и Max. В меню Comfy заходите в аккаунт или регаетесь, пополняете баланс, и генерите.

Вместе с этим BFL запустили Playground, где можно потестить новые модели и даже старые (Pro Ultra). Дают 200 халявных кредитов, одна генерация съедает 4 кредита. По умолчанию выдаётся 4 картинки, так что через троеточие заходите в меню и переключайте их на 1, чтобы сэкономить кредиты. Есть ещё улучшатель промта (promt upsampling), который по умолчанию выключен, но может улучшить детали и стабильность персонажа/объекта.

Опенсорсная Dev версия пока в закрытом бета-тесте, на который можно записаться послав письмо BFL на почту. Что я и сделал.

PS: на что только не пойдут лишь бы Flux Video и Flux 2 не релизить.

Демо (BFL Playground)

Анонс

Comfy

-2
-3
-4
-5
-6
-7
-8
-9
-10