Найти в Дзене
Нейроарт Мастерская

FLUX.1 KREA [dev]: Новая звезда в генерации изображений с открытым кодом.

Здравствуйте, друзья! Представьте: вы вводите запрос вроде «киберпанк-город под неоновым дождём», и через пару секунд перед вами появляется картинка — яркая, детализированная, почти как кадр из голливудского блокбастера. Но иногда вместо шедевра вы получаете слегка размытое лицо или слишком буквальную интерпретацию. Знакомьтесь, это FLUX.1 Krea [dev] — модель генерации изображений из текста от Black Forest Labs и Krea AI, релиз которой состоялся 31 июля 2025 года взбудоражил ИИ-сообщество. Её называют «убийцей Midjourney», но так ли она хороша? Давайте разберёмся, что она умеет, где спотыкается и стоит ли тратить на неё время. FLUX.1 Krea [dev] — это модель с открытым исходным кодом, которая превращает текстовые описания в изображения. Её создали Black Forest Labs (BFL), команда, стоящая за Stable Diffusion, и Krea AI, известные своими удобными интерфейсами для работы с ИИ. Эта модель позиционируется как «опинионированная» (opinion) — у неё есть свой стиль, который старается избегать
Оглавление

Здравствуйте, друзья!

Представьте: вы вводите запрос вроде «киберпанк-город под неоновым дождём», и через пару секунд перед вами появляется картинка — яркая, детализированная, почти как кадр из голливудского блокбастера. Но иногда вместо шедевра вы получаете слегка размытое лицо или слишком буквальную интерпретацию. Знакомьтесь, это FLUX.1 Krea [dev] — модель генерации изображений из текста от Black Forest Labs и Krea AI, релиз которой состоялся 31 июля 2025 года взбудоражил ИИ-сообщество. Её называют «убийцей Midjourney», но так ли она хороша? Давайте разберёмся, что она умеет, где спотыкается и стоит ли тратить на неё время.

Что такое FLUX.1 Krea [dev]?

FLUX.1 Krea [dev] — это модель с открытым исходным кодом, которая превращает текстовые описания в изображения. Её создали Black Forest Labs (BFL), команда, стоящая за Stable Diffusion, и Krea AI, известные своими удобными интерфейсами для работы с ИИ. Эта модель позиционируется как «опинионированная» (opinion) — у неё есть свой стиль, который старается избегать типичных ИИ-артефактов вроде восковой кожи или шаблонных композиций. Но, как и у любого художника, у неё есть свои сильные стороны и слабости.

С 12 миллиардами параметров это одна из крупнейших открытых моделей для генерации изображений. Она построена на архитектуре Rectified Flow Transformer и совместима с экосистемой FLUX.1 [dev], включая интерфейсы ComfyUI и ForgeUI. Веса модели доступны на Hugging Face, а код и примеры — на GitHub.

Как её обучали?

Сейчас создать модель, которая выдаёт изображения которые смогут удивить неискушенного пользователя несложно, но вот человек который уже много сотен моделей "перепробовал" в поисках своего дзена это другое дело. Но Krea AI и BFL подошли к обучению с умом, чтобы сбалансировать качество и разнообразие, хотя как всегда и в этот раз не обошлось без компромиссов.

Этап 1: Предобучение

Модель поглощала огромный массив данных — от фотографий до артов, включая далеко не самые идеальные изображения. Это было сделано сознательно: слишком «глянцевые» данные делают картинки стерильными, без характера. Базой стали веса FLUX.1 [dev] от BFL, которые уже умели создавать чёткие композиции, детализированные объекты и даже текст на изображениях ( вывески или надписи).

Этап 2: Постобучение

Тут началась тонкая работа. Постобучение прошло в два этапа:

  • Тонкая настройка (Supervised Finetuning, SFT): Модель дообучали на отборных высококачественных изображениях, включая синтетические данные от Krea 1. Это придало картинкам «вау-эффект» — реалистичные пейзажи или портреты с живыми текстурами получаются действительно впечатляющими.
  • Обучение с подкреплением (RLHF): На основе отзывов пользователей модель училась создавать изображения, которые цепляют глаз, усиливая эстетическую привлекательность.

Разработчики старались уйти от «ИИ-вида» — переглаженных текстур или скучного освещения. Вместо стандартных метрик вроде FID или CLIP Score, которые могут загнать модель в шаблоны, они ориентировались на человеческое восприятие. Это дало FLUX.1 Krea [dev] свой уникальный стиль. Мне некоторые изображения очень напомнили о всеми уже забытой модели Playground v2.5. Есть что-то в изображениях от этой модели.

Что она умеет? И где спотыкается?

FLUX.1 Krea [dev] — это бесспорно талантливый художник но со своими тараканами в голове и иногда слишком буквально понимает наши слова или часто действует по принципу "что умею то рисую" я художник я так вижу.

Вот как мне кажется, её сильные стороны:

  • Реалистичность: В лучших случаях модель выдаёт картинки, которые можно спутать с профессиональной фотосъёмкой. Пейзажи с заснеженными горами? Детали на уровне National Geographic. Портреты? Кожа выглядит живой, а глаза — с искрой.
  • Уникальный стиль: Модель не пытается угодить всем, предлагая выразительную эстетику, идеальную для концепт-арта или креативных постов в соцсетях.
  • Скорость: Через API (например, FAL) генерация занимает 2–3 секунды благодаря собственной инфраструктуре Krea AI с кучей GPU.
  • Гибкость: Работает с ComfyUI, Forge UI, поддерживает Lora от старого Flux.1 Dev и текстовые энкодеры и локальный запуск. NF4, GGUF или FP8-версии модели помогут тем, у кого GPU послабее.
  • Безопасность: Модель протестирована на устойчивость к запрещённому контенту (CSAM, NCII) и оснащена фильтрами. Только надо ли оно нам вообще?!

Но не всё так гладко. Вот некоторые недочеты, которые обнаружил я и не только:

  • Ограниченная креативность: Из-за фокуса на фотореализм модель может быть слишком буквальной с абстрактными или фантазийными промптами. Попросите «сюрреалистичный лес в стиле Ван Гога» — и результат может оказаться скорее обычным лесом, чем шедевром импрессионизма.
  • Проблемы с лицами: Иногда лица получаются размытыми или с искажениями, особенно если промпт. Хотя пальцы обычно на месте, мелкие детали могут подвести.
  • Зависимость от промптов: Качество сильно зависит от того, насколько точно вы описали сцену. Простое «кот» даст посредственный результат, а «пушистый кот в закатном свете» — уже лучше.
  • Требования к железу: Для FP16 модели нужен GPU с 24 ГБ VRAM, что не всем по карману. FP8 снижает порог до 8–12 ГБ, но для слабых GPU модель всё ещё тяжела и в этом случае стоит посмотреть на NF4 и GGUF квантованные версии.

По оценкам сообщества, модель набрала ELO-рейтинг 1011, обойдя другие открытые версии FLUX и приблизившись к закрытым, вроде FLUX1.1 [pro]. Но до уровня Midjourney она пока не дотягивает в плане креативности.

Как использовать?

FLUX.1 Krea [dev] доступна для всех — от новичков до профи. Вот как можно начать:

1. Через Krea AI

Самый простой способ — платформа Krea AI. Вводите запрос, добавляете до трёх референсных изображений (можно настроить их влияние) и выбираете стиль: Cartoon, CGI, Concept, Photo или Flux Realtime. Генерация занимает 3–6 секунд, предпросмотр появляется почти сразу. Новички получают 10 бесплатных кредитов (3 кредита за картинку). Но есть нюанс: бесплатный лимит быстро кончается, а платные тарифы начинаются от $10/месяц. www.krea.ai.

2. Через ComfyUI

Для тех, кто любит кастомизацию, модель работает с ComfyUI. Если вы уже пользовались FLUX.1 [dev], ничего нового скачивать не надо — просто добавьте веса модели, VAE, T5-XXL и CLIP (ссылки ниже).

3. Через Forge UI

ComfyUI сложноват? Попробуйте веб-интерфейсы вроде Forge UI. Скачиваете подходящую для вашего GPU модель, подключаете — и готово. Это проще, чем кажется, и идеально для тех, кто хочет экспериментировать без глубокого погружения в мир нодов и кода.

Ссылки для старта с FLUX.1 Krea [dev]

Вот всё, что нужно для начала работы с моделью:

В моем телеграм канале я буду выкладывать ссылки на все квантованные версии моделей. Присоединяйтесь.

По умолчанию сэмплер и планировщик: Euler\Simple но можно экспериментировать. Лично мне понравилось как отрабатывает сэмплер DEIS, но это естественно субъективное мнение.

Sampling steps: 28-33

Distilled CFG Scale: 3.5 - 5

Лицензия и ограничения

FLUX.1 Krea [dev] распространяется под некоммерческой лицензией flux-1-dev-non-commercial-license. Вы можете использовать её для личных проектов, исследований или экспериментов, но для коммерции нужна лицензия через BFL Licensing Portal.

Другие ограничения:

  • Факты — не её конёк: Модель создаёт искусство, а не энциклопедические данные. Попросите «исторический портрет Наполеона» — и получите креативную интерпретацию, а не точность.
  • Сложные промпты: Без чётких инструкций результат может быть средним. Нужно учиться составлять запросы. Кто там хмыкал на Prompt Engineering? :-)
  • Этика: Модель протестирована на риски вроде запрещённого контента, хотя фильтры и не идеальны. Пользователи отмечают, что цензура слабее, чем у Midjourney. Так что любителям NSFW ждать кастомных моделей или пользоваться лорами типа Mystic и т.п. P.S: Loras от обычного Flux в большинстве случаев работают и с этой моделью но не все.
-3

Модель хвалят за скорость и качество: «2–3 секунды на FAL, и картинка как из журнала!» Многие сравнивают её с Midjourney, отмечая реалистичность и детализацию. Пользователи в восторге от открытых весов и прозрачности разработчиков — код, тех. отчёт и веса доступны всем. Я, если честно, не разделяю этих щенячьих восторгов по поводу модели. Иногда она всё ещё выдаёт «ИИ-вид», а пальцы и руки частенько оказываются не в нужном месте, несмотря на обещания разработчиков. С фэнтези и сюрреализмом модель пока работает так себе, и из пары десятков изображений приемлемой по запросу была разве что парочка. Проще воспользоваться соответствующей лорой. На некоторых запросах появляется размытость лиц персонажей, избавиться от которой достаточно непросто, и приходится долго ковыряться с промптом. Сравнивая FLUX.1 Krea [dev] и Midjourney, первая явно проигрывает в креативности, особенно для художественных стилей. Зато она выигрывает в скорости и открытости.

Несомненно, FLUX.1 Krea [dev] показывает, что открытые модели могут тягаться с закрытыми гигантами вроде DALL-E или Midjourney, но не без оговорок. Она даёт дизайнерам доступ к качественным визуалам, разработчикам — к гибкому инструменту, а исследователям — к открытой площадке. Но не ждите от неё универсальности: для сложных художественных задач или слабых ПК она может быть далеко не идеальной.

Итог

FLUX.1 Krea [dev] — это талантливый, но немного упрямый художник. Она способна создавать потрясающие картинки, но требует от вас чётких указаний и мощного железа. Если вы дизайнер, разработчик или ИИ-энтузиаст, попробуйте её на Krea AI, в ComfyUI, Forge UI или через API. Скачайте веса с Hugging Face и экспериментируйте! Но будьте готовы к тому, что модель не всегда оправдает возложенных на неё высоких надежд . Стоит ли она вашего времени? Попробуйте и решите сами!

-4

Ну и конечно же, если вам понравилась эта статья, буду рад вашей поддержке и подпискам, комментариям и лайкам. Недавно я запустил Discord-канал и постараюсь поддерживать его насколько возможно, там вы сможете не только следить за новостями, но и общаться, делиться опытом и приобретать новые знания о нейросетях. Чтобы всегда быть в курсе моих новых материалов, подписывайтесь на мой Boosty, Telegram-канал и страницу "ВКонтакте". Пока что нас немного, но я надеюсь, что с течением времени сообщество станет больше. Это станет отличной мотивацией для меня активно работать и над другими социальными сетями.