Найти в Дзене
Usoftware

«Генерация изображений по брифу»: как получить предсказуемый стиль

Статья создана при поддержке магазина Usoftware. Если вы хотите не «разово повезло», а серийный, повторяемый результат, бриф — это ваш контракт с моделью. Он фиксирует стиль, композицию, свет, цвет, форму и ограничения. Чем стабильнее вход — тем стабильнее выход. Причины дрейфа: разные версии модели/сэмплера, случайный seed, слишком общие формулировки.
Фиксаторы предсказуемости: фиксируйте seed, модель/версию, сэмплер/шаги; держите CFG в адекватных пределах; используйте ControlNet (Pose/Depth/Lineart), reference image с весом 0.5–0.8; расширяйте негатив-промпт. [Цель/формат] + [Сюжет и ракурс] + [Стиль и носители] + [Свет/цвет] + [Композиция] + [Ограничения] + [Тех. параметры] Пример (копируемый текст):
Обложка для статьи 1200×675. Рыжий мейн-кун, крупный план, три четверти, взгляд в камеру; минималистичный киношный стиль, мягкая плёнка, лёгкое зерно, плавные полутени. Освещение: softbox слева 45°, тёплый ключ, холодный заполняющий. Палитра: охра, слоновая кость, холодный серый. Ком
Оглавление

Статья создана при поддержке магазина Usoftware.

Если вы хотите не «разово повезло», а серийный, повторяемый результат, бриф — это ваш контракт с моделью. Он фиксирует стиль, композицию, свет, цвет, форму и ограничения. Чем стабильнее вход — тем стабильнее выход.

Из чего состоит хороший бриф (7 блоков)

  1. Цель и формат — где будет жить картинка (обложка 1200×675, карточка 1:1, сторис 1080×1920).
  2. Сюжет / объект — кто/что в кадре, действие, эмоция, ракурс.
  3. Стиль — 3–5 референсов + словарь признаков (минимализм, плоские тени, плёночное зерно).
  4. Свет и цвет — тип освещения и палитра из 3–5 тонов.
  5. Композиция и кадр — правило третей/симметрия, свободные поля под текст.
  6. Ограничения (anti-brief) — чего точно не должно быть.
  7. Технические параметры — соотношение сторон, seed, steps, CFG/Guidance, модель/версия, апскейл.

Почему стиль «плавает» и как его стабилизировать

Причины дрейфа: разные версии модели/сэмплера, случайный seed, слишком общие формулировки.

Фиксаторы предсказуемости: фиксируйте seed, модель/версию, сэмплер/шаги; держите CFG в адекватных пределах; используйте ControlNet (Pose/Depth/Lineart), reference image с весом 0.5–0.8; расширяйте негатив-промпт.

Формула «жёсткого» промпта (скелет)

[Цель/формат] + [Сюжет и ракурс] + [Стиль и носители] + [Свет/цвет] + [Композиция] + [Ограничения] + [Тех. параметры]

Пример (копируемый текст):

Обложка для статьи 1200×675. Рыжий мейн-кун, крупный план, три четверти, взгляд в камеру; минималистичный киношный стиль, мягкая плёнка, лёгкое зерно, плавные полутени. Освещение: softbox слева 45°, тёплый ключ, холодный заполняющий. Палитра: охра, слоновая кость, холодный серый. Композиция: центр кадра, сверху 20% пустого пространства под заголовок, фон плавный градиент. Ограничения: без текста, без логотипов, без watermark, без хроматической аберрации. Параметры: формат 16:9, фикс seed.

Специфика для разных движков

Midjourney (v6/v6.1)

  • Описывайте стиль словами; без переизбытка тегов.
  • Для серии фиксируйте: соотношение сторон, стиль, seed; меняйте только объект/ракурс.
  • Полезные настройки: --ar 16:9, --style raw, --seed (число), --chaos 0–10.

Шаблон MJ (копируемый текст):

[Кадр/объект], [точный стиль 6–10 слов], [свет], [палитра], [композиция]. Ограничения: no text, no watermark, clean background. Параметры: соотношение сторон 16:9, стиль raw, seed (число), chaos (0–10).

Stable Diffusion (SDXL/SD1.5)

  • Три константы: модель + сэмплер + seed.
  • Для повторяемости: Steps 25–35, CFG 4–7 (база для SDXL), DPM++ 2M Karras — частый выбор.
  • Делите промпт на позитив и негатив; держите порядок свойств.

Шаблон SDXL (позитив/негатив), копируемый текст:

Позитив: [объект], [ракурс], [конкретный стиль], soft film grain, gentle contrast, [свет], [палитра], clean gradient background.

Негатив: text, watermark, oversharp, distorted anatomy, chromatic aberration, frame, vignette.

Параметры: CFG 6; Steps 30; Sampler DPM++ 2M Karras; Seed (число); Size 1216×704.

DALL·E / Firefly

  • Лучше «понимают» описания; слабее реагируют на техпараметры.
  • Для повторяемости используйте один и тот же словарь/порядок характеристик и референсы.

Мини-пайплайн из 5 шагов (серии под один стиль)

  1. Style Card: эталонный кадр + текстовая формула стиля (50–80 слов).
  2. Фиксируем технику: модель, версия, seed, сэмплер, CFG, размер.
  3. Генерим серию 4–8 вариантов и отбираем 1–2 эталона.
  4. Правим по одному параметру за итерацию (свет ИЛИ ракурс и т. п.).
  5. Документируем: заносим всё в таблицу/название файлов.

Чек-лист перед запуском

  • Есть 3–5 референсов + словарь стиля.
  • Зафиксированы: модель/версия, сэмплер, CFG, steps, seed, размер.
  • Прописаны свет, палитра, композиция и «поля» под текст.
  • Есть анти-брейф (негатив-промпт).
  • Нейминг файлов содержит ключевые параметры.
  • Для людей: ControlNet Pose/Lineart для повторяемости позы.

Частые ошибки и как чинить

  • Пластик/перешарп — снизьте CFG, уберите «ultra-sharp», добавьте «soft film grain».
  • Плывёт композиция — ControlNet (Pose/Depth/Lineart), уточните «center composition, headroom 20%».
  • Скачет палитра — задайте конкретные цвета (HEX/Pantone).
  • Лезет текст/логотипы — расширьте негатив: no text/captions/watermark/signatures.
  • Несовпадает ракурс в серии — фиксируйте seed и параметры камеры (three-quarters, 50mm, eye-level).

Готовые шаблоны брифа (копируемый текст)

1) Карточка товара, минимализм

Цель: карточка товара 1:1 для маркетплейса.

Объект: термокружка из матовой стали, фронтально, без руки.

Стиль: студийный минимализм, мягкие тени, лёгкое зерно.

Свет: softbox сверху 30%, заполняющий справа.

Цвет: стальной серый, белый фон, лёгкая теплота.

Композиция: центр, низ кадра свободен 15% под цену.

Ограничения: без текста, логотипов, воды, без бликов на металле.

Техпараметры: 1024×1024; seed 31415; CFG 6; Steps 30; Sampler DPM++ 2M Karras.

2) Персонаж бренда (серия поз)

Цель: набор из 6 изображений 4:5 для соцсетей.

Объект: дружелюбный робот-ассистент, круглая голова, линейные глаза.

Стиль: плоская иллюстрация, мягкие тени, пастель.

Свет/цвет: тёплый ключ; палитра — мятный/персик/графит.

Композиция: правило третей, поле сверху 25% под текст.

Ограничения: без надписей, без фоновых объектов.

Техпараметры: фикс seed 777; Steps 28; CFG 5.5; ControlNet Pose для повторяемости.

3) Обложка статьи в Дзене

Цель: обложка 1200×675 для Яндекс Дзена.

Объект: автор за ноутбуком, вид сбоку, сосредоточенный.

Стиль: кинематографично, мягкий контраст, плёночное зерно.

Свет: окно слева, тёплый контровой.

Цвет: палитра — индиго, тёплый беж, тёмно-серый.

Композиция: герой справа, слева 35% чистого фона под заголовок.

Ограничения: без текста/логотипов/водяных знаков/рамок.

Техпараметры: 16:9 (или 1200×675); seed 2025; CFG 6; Steps 30.

Итог: формула предсказуемости

Константы (модель + seed + сэмплер + CFG) + фиксированный словарь стиля + контроль композиции (Control/рефы) + документация. Меняйте только одну переменную за раз — и стиль будет воспроизводимым, а серии — ровными.