Что произошло: немецкий стартап Black Forest Labs выпустил FLUX.2
Помимо Google Gemini 3, Anthropic Claude Opus 4.5 и других звёзд осеннего сезона ИИ, вот к нам пришла ещё одна крутая штука — FLUX.2. Немецкий стартап Black Forest Labs представил совершенно новую систему для генерации и редактирования изображений. Причём это не просто одна модель — целых четыре модели, каждая заточена под разные задачи.
Что самое интересное? Компания выпустила это с открытым исходным кодом. Ну, частично — VAE (это такой модуль, который сжимает изображения и потом разворачивает их обратно в высоком качестве) выложили под лицензией Apache 2.0. Остальные модели — Pro, Flex и Dev — это микс из закрытых и полу-открытых решений.
Почему это важно прямо сейчас
FLUX.2 вводит несколько серьёзных улучшений: теперь можно использовать до десяти изображений для условия (то есть для задания стиля или деталей), качество текста на картинках стало намного лучше, и вообще всё работает стабильнее. Но главное — это смещение фокуса. Если раньше эти системы были больше про экспериментальные демки, то теперь речь идёт о реальной работе: маркетинг, дизайн, коммерческие проекты.
Мультиреференсное кондиционирование: в чём фишка
Представьте: вы хотите создать серию картинок для каталога, но в каждой должны быть одинаковые персонажи или элементы дизайна. Раньше это было головной болью. Теперь FLUX.2 может сохранять черты характера, стиль и детали на протяжении целой серии изображений — до десяти за один раз. Это экономит кучу времени и нервов.
Кроме того, система лучше понимает сложные многоэтапные промпты (то есть инструкции с несколькими условиями). Раньше модели часто путались: мол, что здесь главное, что второстепенное? Теперь — куда более предсказуемо.
О ценах и конкуренции с Google
Здесь становится по-настоящему интересно. FLUX.2 Pro стоит примерно $0.03 за мегапиксель. Если вам нужно сгенерировать квадратное изображение 1024х1024 — это один мегапиксель, то есть три цента. Для высоких разрешений цена масштабируется пропорционально.
Сравните с Google Nano Banana Pro (это их новая фишка): там за изображение размером 1K-2K пиксела вы заплатите примерно 13.4 цента. То есть вычислится, что FLUX.2 дешевле минимум в четыре раза. Для 4K изображений разница вообще уходит в восемь раз.
Ладно, ценовое преимущество понятно. Но качество? Тесты показывают (согласно данным BFL), что FLUX.2 Dev лидирует среди открытых моделей — 66.6% win rate в текст-в-изображение, 59.8% в редактировании по одной картинке, 63.6% в редактировании по нескольким. Конкуренты типа Qwen-Image и Hunyuan Image 3.0 заметно отстают.
Для кого это реально полезно
Инженеры, которые отвечают за ИИ системы, получают красивую фишку: можно выбрать между облачными эндпоинтами (Pro и Flex) или запустить Dev локально на своих серверах. Это даёт гибкость. Нужна скорость — берёшь Pro. Нужна контроль над параметрами (количество шагов, guidance scale) — выбираешь Flex. Хочешь всё держать в доме на своих мощностях — вот тебе Dev.
Для команд, которые управляют данными, FLUX.2 несёт свою фишку — улучшенная реконструкция изображений означает, что генерируемые картинки будут чище и предсказуемее. Это упрощает жизнь в пайплайнах, где эти изображения потом идут в аналитику или в другие системы ИИ.
А команды безопасности и compliance-а оценят то, что VAE открытый и прозрачный. Вы видите, как работает сжатие, можете аудировать, всё аккуратно лицензировано под Apache 2.0. Это облегчает согласование с регуляторами, особенно если компания находится в какой-нибудь строгой юрисдикции.
Технический батник: что там внутри
FLUX.2 построен на архитектуре latent flow matching — комбинация трансформера с выпрямленным потоком и vision-language модели на основе Mistral-3 (24 млрд параметров). Это звучит сложно, но суть простая: модель понимает язык (спасибо VLM) и одновременно разбирается в пространстве и освещении (спасибо трансформеру).
Главное улучшение — переделали всё внутреннее пространство представлений (latent space). FLUX.2 VAE достигает меньше искажений (LPIPS) чем FLUX.1 и Stable Diffusion, но при этом сохраняет хорошую обучаемость для генеративных моделей. Это было давнишней проблемой: сильно сжимаешь пространство — улучшаешь обучение, но теряешь качество реконструкции. Не сжимаешь — качество хорошее, но сложнее обучать. Здесь нашли баланс.
Что внутри коробки: пять вариантов
- FLUX.2 Pro: топовая производительность, минимальные задержки, максимальное качество. Доступна через API и партнёрские платформы. Цена как я уже писал — по мегапиксельям.
- FLUX.2 Flex: даёт вам ручки — регулируешь количество шагов отрисовки, параметр guidance. Нужно быстро — отрисуешь на малом числе шагов. Нужно красиво — включишь больше шагов.
- FLUX.2 Dev: вот это интересно — 32 млрд параметров, открытые веса, можешь скачать и запустить локально. Сразу поддерживает и генерацию, и редактирование, и мультиреференсное кондиционирование. Можно оптимизировать под fp8 через NVIDIA и ComfyUI.
- FLUX.2 Klein: ещё в разработке, выйдет под Apache 2.0. Уменьшенная версия для тех, кому важен размер и скорость.
- FLUX.2 VAE: вот то самое ядро, которое открыли. Работает для всех остальных вариантов.
Экосистема и открытая философия
Black Forest Labs — это компания, созданная тремя создателями Stable Diffusion (Robin Rombach, Patrick Esser и Andreas Blattmann). Они отвалили из Stability AI и создали BFL в 2024-м. Получили 31 млн долларов инвестиций (ведут Andreessen Horowitz). И с самого начала выбрали путь: открытое + коммерческое.
FLUX.1 (предыдущая версия) уже завоевала репутацию — выдавала качество, сравнимое с закрытыми Midjourney v6 и DALL-E 3, но при этом была открыта. И теперь FLUX.2 продолжает этот тренд: открытое ядро (VAE) плюс гибкая экосистема для разных потребностей.
Для менеджеров и руководителей бизнеса
Если вы отвечаете за ИИ стратегию компании, вот что нужно понимать: FLUX.2 снижает барьеры входа. Раньше чтобы работать с генерацией изображений, нужно было либо платить Midjourney, либо разбираться с облачными сервисами. Теперь у вас есть вариант — берёшь Dev модель, ставишь себе на сервер, платишь только за вычисления.
Улучшение в работе с текстом на картинках — это серьёзно. Если вы делаете инфографику, баннеры, презентации — раньше было мучение заставить ИИ вписать текст правильно. Теперь работает намного лучше. Один разработчик в сети вообще написал, что результаты «absolutely bonkers» (прямо бешеные).
Мультиреференсная генерация означает, что можно быстрее наделать вариантов для A/B тестирования, маркетинговых кампаний, каталогов товаров. Это экономит неделю работы дизайнеров.
Что дальше
Судя по всему, Black Forest Labs собирается развивать эту линию дальше. Они уже говорят про многомодальные системы, которые будут объединять восприятие, память, рассуждение и генерацию. Компания растёт — нанимает людей в Фрайбурге и Сан-Франциско.
Рынок становится интереснее. Вместо одной Google или OpenAI, которые диктуют условия, теперь есть выбор. FLUX.2 доказывает, что открытые подходы могут конкурировать с закрытыми системами на уровне качества и при этом давать пользователям больше контроля.
Генеративный ИИ развивается стремительно — каждый месяц появляются новые модели, новые возможности и новые ценовые точки. Если вы хотите остаться в курсе и не пропустить следующий «FLUX.2», который изменит индустрию…🔔 Подпишитесь на мой канал «ProAI» в Telegram! Там я разбираю новые модели, рассказываю про практическое применение ИИ в бизнесе и делюсь находками из мира генеративных технологий.