ChatGPT сегодня можно использовать не только для текста, но и для создания изображений и фото. С помощью правильных промптов можно генерировать новые картинки, редактировать существующие изображения и управлять стилем визуалов прямо внутри чата.
В этом гайде разберём, как работает генерация изображений в ChatGPT, как правильно писать промпты и как получать стабильный результат.
Основной акцент сделан на прикладных навыках: формулировке запросов, управлении стилем, работе с референсами, исправлении ошибок генерации и создании серий изображений.
Теоретическая часть сведена к минимуму и используется только для объяснения того, какие элементы запроса нужно менять, чтобы получать предсказуемый результат.
Важно понимать одну особенность материала.
Несмотря на то что примеры в гайде показываются на основе ChatGPT, большая часть принципов генерации изображений универсальна и работает в большинстве современных ИИ‑генераторов.
Эти принципы можно применять, например, в:
— Midjourney
— Алиса AI
— Kandinsky
— Stable Diffusion
— Leonardo AI
— Ideogram
— Adobe Firefly
— других генераторах изображений
Причина в том, что большинство систем генерации изображений работают по похожему принципу: модель интерпретирует текстовое описание сцены и на его основе строит визуальную композицию.
Поэтому такие методы, как:
— формулирование сцены
— управление стилем
— фиксация композиции
— работа с референсами
— генерация серий изображений
— исправление типовых ошибок
работают почти одинаково во всех генераторах изображений.
При этом в гайде есть несколько разделов, которые относятся конкретно к экосистеме ChatGPT. Это связано с особенностями интерфейса и инструментов платформы.
К таким темам относятся:
— работа через проекты
— использование кастомных GPT
— особенности генерации изображений внутри одного чата
— ограничения генерации в разных типах аккаунтов
Эти элементы полезны именно для пользователей ChatGPT, но сами принципы создания изображений остаются универсальными.
1. Введение
Что даст этот гайд
Этот гайд предназначен для пользователей, которые уже создавали простые изображения в генераторах ИИ и хотят перейти к более управляемой и стабильной работе с визуалами.
Главная задача материала — показать, как превратить генерацию изображений из случайного эксперимента в понятный рабочий инструмент.
Частая ситуация выглядит так: пользователь пишет короткий запрос, получает случайный результат и пытается несколько раз повторить генерацию в надежде, что появится удачная картинка. Такой подход редко даёт стабильный результат.
В реальной работе изображения почти всегда создаются через последовательные итерации уточнения запроса.
Сначала формируется базовая сцена, затем уточняется композиция, после этого добавляется стиль и корректируются детали. Когда этот процесс становится управляемым, генерация изображений начинает работать как инструмент, а не как лотерея.
Практически это применяется в следующих задачах:
— создание обложек для статей
— визуалы для Telegram‑каналов и блогов
— рекламные креативы
— иллюстрации для текстов
— серии изображений в одном стиле
— комиксы и визуальные истории
Например, автору статьи может понадобиться обложка, которая за секунду передаёт идею материала. Вместо случайной картинки можно задать точную сцену, стиль и композицию и получить изображение, которое сразу считывает смысл текста.
Критерий правильного применения материала: пользователь может сформулировать запрос так, чтобы изображение передавало нужную идею и стиль после нескольких итераций, а не после десятков случайных генераций.
Смысл этого раздела состоит в том, что генерация изображений становится эффективной тогда, когда пользователь управляет структурой запроса.
Что входит и что не входит в гайд
Чтобы материал оставался прикладным, гайд ограничен темой создания и редактирования изображений с помощью генераторов ИИ.
В гайд входят следующие темы:
— генерация изображений по текстовому описанию
— создание промптов
— управление стилем
— работа с визуальными референсами
— построение композиции
— создание серий изображений
— генерация комиксов
— исправление типовых ошибок
— подготовка визуалов под конкретные задачи
Например, если автор ведёт Telegram‑канал и регулярно делает иллюстрации, в гайде показывается, как удерживать единый стиль серии и не получать каждый раз случайный результат.
В гайд не входят темы, требующие отдельных профессиональных инструментов:
— генерация видео
— сложный графический дизайн
— профессиональные 3D‑пайплайны
— работа в специализированных дизайнерских программах
— детальный разбор сторонних сервисов дизайна
Критерий правильного понимания границ гайда: пользователь применяет генераторы изображений для создания визуалов, но не пытается решать задачи полноценного графического дизайна, которые требуют специализированного программного обеспечения.
Смысл этого ограничения в том, что материал сосредоточен на максимально эффективной работе именно с генерацией изображений.
Мини‑правила на старте
Перед началом работы важно понимать несколько базовых принципов генерации изображений. Эти правила позволяют избежать типовых ошибок и значительно ускоряют получение нужного результата.
Одна картинка — одна идея. Если в запросе одновременно пытаются показать несколько разных смыслов, изображение становится перегруженным. Лучше формулировать одну центральную сцену.
Один стиль — одна серия. Если изображения должны работать как серия, стиль необходимо фиксировать. Резкая смена стиля разрушает визуальное единство.
Не ожидать идеальный результат с первой генерации. Работа с изображениями почти всегда проходит через несколько уточнений запроса.
Работать итерациями. Сначала задаётся базовая сцена, затем уточняется стиль, после этого корректируются детали.
Сначала смысл, потом красота. Изображение должно сначала передавать идею. Декоративные детали добавляются после того, как понятна композиция.
Если изображение используется как обложка или рекламный визуал, оно должно считываться за 1–2 секунды. Например, если обложка статьи посвящена выгоранию на работе, на изображении может быть человек за столом, заваленным бумагами, с уставшей позой. Такая сцена быстро передаёт смысл темы.
Критерий правильной работы: человек, впервые увидевший изображение, может быстро понять идею картинки без дополнительного объяснения.
Главный принцип этого раздела заключается в том, что генерация изображений начинается не со стиля, а с понятной визуальной идеи сцены.
Ограничения генерации изображений
При работе с изображениями важно учитывать ограничения конкретной платформы.
В случае ChatGPT количество генераций может зависеть от типа аккаунта.
В бесплатной версии обычно доступно примерно от двух до пяти генераций изображений в сутки. Точный лимит может меняться в зависимости от нагрузки сервиса.
В платных подписках, например ChatGPT Plus, количество генераций значительно выше и обычно составляет десятки изображений в день.
Сегодня вечером я сгенерировал 54 картинки примерно за 2 часа на тарифе Plus. Система не выдала ограничений — я завершил работу, поскольку выполнил запланированный объём. При необходимости можно было продолжить.
Иногда лимит обновляется приблизительно через двадцать четыре часа после достижения ограничения.
Например, если пользователь исчерпал лимит генераций вечером, новые изображения могут стать доступны на следующий день после обновления квоты.
Критерий правильного понимания ограничения: пользователь планирует генерации и использует их осмысленно, а не тратит лимит на случайные эксперименты.
Практическое следствие этого правила состоит в том, что каждая генерация должна быть шагом в доработке изображения, а не случайной попыткой получить удачный результат.
Как работать с картинками: обычный чат, проект или кастомный GPT
Перед началом работы с изображениями важно выбрать формат среды, в которой будет происходить генерация. В ChatGPT существует три основных режима работы: обычный чат (1), проекты (2) и кастомные GPT (3). Каждый из них подходит для разных типов задач.
Понимание различий между этими режимами позволяет выстроить более стабильный рабочий процесс и избежать ситуации, когда стиль изображений постоянно меняется.
Обычный чат
Обычный чат подходит для быстрых и разовых задач.
Он удобен, когда нужно:
— создать одну картинку
— придумать идею визуала
— быстро протестировать новый промпт
— попробовать разные стили
Механика работы здесь простая. Пользователь формулирует запрос, получает изображение и при необходимости уточняет описание сцены.
Например, можно протестировать идею будущей обложки статьи:
«Иллюстрация: человек сидит ночью за ноутбуком, вокруг тёмная комната, свет экрана освещает лицо, атмосфера усталости, кинематографический свет».
Такой режим хорошо подходит для поиска идеи или первичного тестирования визуальной сцены.
Недостаток обычного чата состоит в том, что каждый новый диалог практически не сохраняет контекст предыдущей работы. Поэтому стиль изображений может меняться от генерации к генерации.
Критерий правильного использования: обычный чат применяется для быстрых экспериментов и поиска идей, а не для долгих серий изображений.
Основная мысль этого блока заключается в том, что обычный чат — это инструмент быстрой проверки гипотез, а не основная среда для долгой работы над серией визуалов.
Проекты
Проекты подходят для ситуаций, когда изображения создаются регулярно и должны сохранять единый стиль.
Этот режим удобен для следующих задач:
— ведение блога
— оформление Telegram‑канала
— серия иллюстраций
— визуалы для образовательного курса
— рекламные креативы
В проекте можно сохранить рабочие материалы:
— правила генерации изображений
— описание стиля
— примеры удачных визуалов
— шаблоны промптов
За счёт этого модель начинает опираться на накопленный контекст проекта, и стиль изображений становится значительно стабильнее.
Например, если в проекте закреплён стиль минималистичных иллюстраций с мягкими пастельными цветами, новые изображения будут чаще придерживаться той же визуальной логики.
Критерий правильного применения: изображения, созданные в одном проекте, визуально выглядят как часть одной серии.
Смысл использования проектов состоит в том, чтобы фиксировать правила генерации и удерживать единый визуальный язык.
Кастомный GPT
Кастомный GPT — это отдельный настроенный помощник, созданный под конкретную задачу.
Внутри него можно заранее задать:
— структуру промптов
— стиль проекта
— правила композиции
— ограничения генерации
Фактически кастомный GPT работает как узкоспециализированный инструмент генерации.
Например, можно создать отдельный GPT для генерации обложек статей. В инструкции такого помощника фиксируется структура запроса, тип композиции и стиль иллюстраций.
После этого пользователь может отправлять короткие задачи, а модель будет автоматически разворачивать их в полноценный промпт для генерации изображения.
Однако создание кастомного GPT имеет смысл только в том случае, если изображения генерируются регулярно и в большом количестве в одном формате.
Критерий правильного использования: пользователь применяет кастомный GPT для повторяющихся задач, где структура изображения почти не меняется.
Главная идея этого блока состоит в том, что кастомный GPT превращает процесс генерации изображений в частично автоматизированный инструмент.
Практическое правило
Выбор режима работы можно упростить до одного практического принципа.
Если задача разовая, достаточно использовать обычный чат.
Если изображения создаются регулярно для одного направления, лучше работать через проекты, чтобы сохранить стиль и рабочие правила.
Если требуется регулярно создавать большое количество изображений по одной структуре, рационально использовать кастомный GPT.
На практике чаще всего используется комбинированная схема работы:
— идеи и эксперименты проверяются в обычном чате
— рабочая генерация выполняется внутри проекта
— массовая генерация под конкретную задачу автоматизируется через кастомный GPT
Например, сначала в обычном чате тестируется визуальная идея будущих обложек. После того как стиль найден, работа переносится в проект, где формируется серия изображений. Если обложки начинают выпускаться регулярно, создаётся отдельный кастомный GPT для их быстрой генерации.
Критерий правильной организации процесса: изображения в серии сохраняют единый стиль, а время на создание новых визуалов постепенно сокращается.
Смысл этого правила состоит в том, что правильный выбор среды работы позволяет одновременно сохранять стиль, ускорять генерацию и снижать количество лишних итераций.
2. Как устроена генерация изображений
Как модель читает промпт
Когда пользователь пишет запрос для генерации изображения, модель не воспринимает текст так же, как человек. Она разбирает описание на отдельные смысловые элементы и на их основе собирает визуальную сцену. Чем понятнее и структурированнее описание, тем более предсказуемым становится результат.
На итоговую картинку сильнее всего влияют несколько ключевых компонентов.
Объект. Это главный элемент изображения. Модель должна понимать, что находится в центре сцены: человек, робот, автомобиль, дом, животное или любой другой объект.
Действие. Действие показывает, что происходит с объектом. Один и тот же персонаж может выглядеть совершенно по-разному в зависимости от действия. Например, человек может читать книгу, работать за ноутбуком, идти по улице или разговаривать по телефону.
Сцена. Сцена определяет окружение. Это может быть офис, улица ночью, лес, кафе, космическая станция или квартира. Описание сцены помогает модели выбрать пространство, в котором размещается главный объект.
Композиция. Композиция отвечает за расположение элементов внутри кадра. Например: крупный план, вид сверху, объект по центру кадра, персонаж на переднем плане.
Стиль. Стиль определяет художественный характер изображения. Это может быть реалистичная фотография, иллюстрация, комикс, 3D-рендер, минималистичная графика или акварельная живопись.
Свет. Освещение формирует восприятие сцены. Мягкий утренний свет, неоновая подсветка, драматический контрастный свет или тёплый ламповый свет создают совершенно разное настроение изображения.
Атмосфера. Атмосфера задаёт эмоциональное ощущение сцены. Она может быть спокойной, тревожной, уютной, футуристической или напряжённой.
Детали. Детали уточняют изображение и делают его более выразительным: предметы на столе, одежда персонажа, элементы интерьера, текстуры материалов.
Если часть этих элементов отсутствует или описана слишком расплывчато, модель начинает самостоятельно дополнять сцену. В результате изображение может получиться случайным и не соответствовать ожиданиям.
Например, запрос «человек работает за компьютером» оставляет модели слишком много вариантов интерпретации. Она может выбрать любое помещение, любую позу и любой стиль.
Смотрите пример ниже, что он сделал под запрос -"человек работает за компьютером" 😢
Если добавить сцену и атмосферу, изображение становится более предсказуемым.
«Человек работает за ноутбуком ночью, тёмная комната, свет экрана освещает лицо, кинематографический свет, реалистичная фотография».
Теперь Чат ГПТ понял, что от него хотят и сделал то что нам нужно))
Критерий корректного запроса: в описании есть понятный объект, действие и сцена, а стиль и освещение уточняют характер изображения.
Ключевая идея этого блока заключается в том, что модель собирает изображение из набора визуальных параметров, которые пользователь задаёт в тексте запроса.
Пример полного промпта
«Молодой мужчина работает за ноутбуком ночью в тёмной комнате. Он сидит за деревянным столом, слегка наклонившись к экрану. Единственный источник света — голубоватое свечение ноутбука, которое освещает его лицо и руки. На столе лежит блокнот, ручка и чашка кофе. На заднем плане тёмная комната с мягкими тенями и размытыми деталями. Крупный план, камера немного сбоку от стола, кинематографическая композиция, мягкая глубина резкости, атмосферное ночное освещение. Реалистичная фотография, высокий уровень детализации, мягкие тени, спокойная рабочая атмосфера».
Что здесь за что отвечает:
Объект - молодой мужчина.
Действие - работает за ноутбуком.
Сцена - ночная комната, рабочий стол.
Композиция - крупный план, камера сбоку.
Свет - свет экрана ноутбука.
Стиль - реалистичная фотография.
Атмосфера - тихая ночная рабочая обстановка.
Детали - чашка кофе, блокнот, ручка, тени, глубина резкости.
Универсальная структура промпта для генерации изображений
Хороший промпт обычно состоит из нескольких логических блоков. Каждый блок отвечает за отдельный параметр изображения.
Структура выглядит так: объект → действие → сцена → композиция → свет → стиль → атмосфера → детали → качество
а. Объект
Это главный элемент изображения. Модель должна понимать, что находится в центре сцены.
Примеры:
- человек
- девушка
- робот
- автомобиль
- старый дом
- космический корабль
Лучше указывать объект максимально конкретно.
Например: не просто человек, а молодой мужчина или пожилой профессор.
б. Действие
Этот элемент показывает, что происходит в сцене.
Примеры:
- работает за ноутбуком
- идёт по улице
- читает книгу
- держит чашку кофе
- смотрит в окно
Действие делает сцену живой и понятной.
в. Сцена
Сцена задаёт окружение.
Примеры:
- в уютном кафе
- в тёмной комнате
- на городской улице
- в лесу
- на космической станции
Сцена отвечает за пространство изображения.
г. Композиция
Композиция описывает, как расположена камера и объекты.
Примеры:
- крупный план
- вид сверху
- вид сбоку
- объект в центре кадра
- персонаж на переднем плане
Композиция сильно влияет на визуальное восприятие изображения.
д. Свет
Освещение формирует атмосферу изображения.
Примеры:
- мягкий утренний свет
- неоновая подсветка
- драматический контрастный свет
- тёплый ламповый свет
- свет от экрана ноутбука
Свет — один из самых сильных элементов визуального настроения.
е. Стиль
Стиль определяет художественный характер изображения.
Примеры:
- реалистичная фотография
- иллюстрация
- комикс
- 3D-рендер
- минималистичная графика
- акварель
Если стиль не указан, модель выбирает его самостоятельно.
ж. Атмосфера
Атмосфера задаёт эмоциональное ощущение сцены.
Примеры:
- уютная атмосфера
- тревожное настроение
- футуристическая атмосфера
- спокойная вечерняя сцена
Этот элемент усиливает визуальный эффект изображения.
з. Детали
Детали делают сцену более живой и реалистичной.
Примеры:
- чашка кофе на столе
- книги рядом
- дождь за окном
- туман на улице
- мягкие тени
Но важно не перегружать изображение большим количеством деталей.
и. Качество
Этот блок уточняет техническое качество изображения.
Примеры:
- высокая детализация
- кинематографический стиль
- мягкая глубина резкости
- фотореализм
Шаблон промпта
Вот готовая формула, которую можно использовать для создания запроса.
Шаблон - объект + действие + сцена + композиция + свет + стиль + атмосфера + детали + качество.
Пример по шаблону
Молодая женщина работает за ноутбуком в тёмной комнате, крупный план, камера сверху, свет неон освещает лицо, кинематографический свет, реалистичная фотография, нервная рабочая атмосфера, на столе открытая пачка Доширак и бронзовая массивная пепельница, высокая детализация.
Картиночник добавил кружку, о чем мы его не просили. Попросим ее убрать: так, картинка сделана отлично, мы всё сохраняем, ничего не меняем. Убери только кружку, её я не просил изначально, остальное всё оставь без изменения. Выведи новую картинку в формате PNG.
Я прошу часто в запросе - Выведи новую картинку в формате PNG - т.к. Чат ГПТ порой сбивается и начинает делать не картинку, а выводить текст, улучшая выданный ему промпт.
✅ Критерий правильного использования шаблона
Если из текста запроса можно понять:
- кто находится в сцене
- что происходит
- где происходит
- как выглядит кадр
- какой стиль изображения
значит промпт составлен правильно.
Границы модели без философии
Даже при хорошем описании сцены генераторы изображений имеют ряд типовых ограничений. Они связаны с тем, как обучаются модели и как формируется итоговая картинка.
Одно из самых распространённых ограничений связано с текстом на изображении. Модель может создавать короткие надписи, но длинные фразы часто получаются искажёнными или содержат ошибки.
Следующая проблема — мелкие детали. Когда в сцене присутствует большое количество небольших объектов, модель может упрощать их форму или случайно изменять элементы изображения.
Отдельная сложность — руки и пальцы. Иногда генераторы создают лишние пальцы или неестественные положения рук.
Трудности могут возникать и с логотипами. Попытка точно воспроизвести известные бренды часто приводит к искажённым или частично изменённым символам.
Ещё одна проблема появляется в сценах с большим количеством мелких объектов. Когда в кадре слишком много элементов, композиция может становиться хаотичной, а детали начинают теряться.
Генераторы также плохо справляются с точным повторением одного и того же лица на разных изображениях. Даже при одинаковом описании персонаж может немного меняться.
Например, если попытаться создать сцену с большим количеством людей, у каждого из которых сложная поза и детализированная одежда, модель может начать упрощать фигуры или менять расположение персонажей.
Критерий правильной работы с ограничениями: пользователь старается упрощать сцену, выделять главный объект и избегать перегруженных композиций.
Практический смысл этого раздела заключается в том, что понимание ограничений модели позволяет сразу формулировать более реалистичные и управляемые запросы.
Мини-практика
Чтобы увидеть, как детализация запроса влияет на результат, полезно сгенерировать одну и ту же сцену в нескольких вариантах описания.
Рассмотрим пример.
Короткий запрос - «Человек управляет автомобилем».
Этот вариант задаёт только объект и действие. Остальные параметры модель определяет самостоятельно: машину, стиль, освещение и атмосферу.
Средний запрос
«Женщина управляет спортивным автомобилем кабриолет, она одета в топик и шорты, тёплый свет, вечерняя атмосфера».
Здесь появляется сцена и настроение. Изображение становится более определённым: появляется интерьер авто и конкретная атмосфера.
Подробный запрос
«Юная девушка блондинка управляет спортивным автомобилем кабриолет, она одета в топик и шорты, тёплый свет, вечерняя атмосфера. Девушка одной рукой поправляет прическу, другая рука на руле, вид сверху, реалистичная фотография. Она едет по побережью океана, красивый закат, чайки, волны».
Только бот добавил третью руку, такое бывает, просим его убрать: Так, отличная картинка, только почему-то у девушки три руки. Убери левую руку с руля, то есть правая рука держит руль, а левая рука поправляет волосы. Остальное всё оставь без изменений.
В этом варианте уточняется сцена, добавляются детали и фиксируется стиль изображения.
После генерации этих трёх вариантов обычно становится заметно, что чем точнее описана сцена, тем ближе итоговое изображение к ожидаемому результату.
Критерий выполнения практики: мы видим, что увеличение конкретики в описании делает изображение более управляемым и предсказуемым.
Смысл упражнения состоит в том, чтобы на практике увидеть, как структура запроса влияет на итоговую генерацию изображения.
Идеальная структура промпта
Генерация изображений начинает работать предсказуемо только тогда, когда запрос имеет понятную внутреннюю структуру. Если промпт написан хаотично, модель сама достраивает сцену и результат становится случайным.
Структура промпта нужна не для красоты текста, а для управления изображением. Она позволяет отдельно контролировать объект, сцену, стиль, свет и важные детали.
Практически любой сильный запрос можно разобрать на несколько логических блоков. Ниже показаны две рабочие схемы: базовая и продвинутая.
Базовая формула
Базовая формула — это самый простой способ быстро собрать понятный промпт.
Кто или что → что делает → где → стиль → свет → настроение → ключевые детали
Каждый элемент отвечает за конкретную часть будущего изображения.
Кто или что. Главный объект сцены. Это может быть человек, предмет, животное, персонаж или символический объект.
Что делает. Действие. Оно превращает статичную картинку в сцену.
Где. Окружение: помещение, улица, природа, интерьер.
Стиль. Художественный язык изображения: фотография, иллюстрация, кино-кадр, комикс.
Свет. Тип освещения: утренний свет, неон, мягкий вечерний свет, драматический контраст.
Настроение. Эмоциональный фон сцены: спокойствие, тревога, напряжение, уют.
Ключевые детали. 2–5 элементов, которые усиливают сцену.
Пример по базовой формуле
Мужчина работает за ноутбуком ночью в небольшой квартире, реалистичная фотография, свет экрана освещает лицо, тихая рабочая атмосфера, на столе чашка кофе и блокнот.
Такой запрос уже даёт модели достаточно информации, чтобы построить осмысленную сцену.
Критерий корректного применения
Если по тексту промпта можно быстро понять:
- кто находится в кадре
- что происходит
- где происходит сцена
- какой стиль изображения
значит базовая структура соблюдена.
Базовая формула нужна для быстрой генерации понятных сцен, когда не требуется сложная постановка кадра.
Продвинутая формула
Когда требуется более точный визуальный результат, используется расширенная структура.
Сюжет → композиция → ракурс → свет → цвет → фактура → стиль → ограничения → важные акценты
Такая схема ближе к логике работы фотографа или режиссёра.
Сюжет. Что происходит в сцене.
Композиция. Как распределены элементы в кадре.
Ракурс. Откуда смотрит камера.
Свет. Характер освещения.
Цвет. Общая цветовая палитра.
Фактура. Материалы и текстуры.
Стиль. Художественный язык изображения.
Ограничения. Что нельзя добавлять в сцену.
Важные акценты. Элементы, которые должны привлекать внимание.
Пример продвинутого промпта
Юная женщина работает за ноутбуком поздно ночью, усталая, слегка наклонилась к экрану. Она сидит за столом в центре кадра, камера немного сбоку, средний план. Единственный источник света — холодное свечение ноутбука. Цветовая палитра тёмно-синяя и холодная. Деревянный стол, матовая поверхность, мягкие тени. Кинематографическая фотография. Без текста, без лишних людей. Акцент на лице и руках, освещённых экраном.
Такой запрос управляет не только сценой, но и визуальной драматургией кадра.
Критерий правильного применения
После генерации изображения можно заметить, что:
- композиция стала более контролируемой
- свет и цвет выглядят предсказуемо
- внимание сосредоточено на нужных элементах
Продвинутая формула используется в тех случаях, когда изображение должно выглядеть как продуманный кадр, а не случайная иллюстрация.
Три шаблона для копирования
Чтобы не собирать структуру каждый раз вручную, удобно использовать готовые шаблоны.
Короткий шаблон
Используется для быстрых генераций.
Объект, действие, сцена, стиль изображения, свет, атмосфера, несколько ключевых деталей.
Пример: Женщина читает книгу у окна, уютная квартира, реалистичная фотография, мягкий вечерний свет, спокойная атмосфера, плед и чашка чая.
Рабочий шаблон
Подходит для большинства практических задач.
Кто или что в сцене → действие → где происходит → композиция → свет → стиль → атмосфера → ключевые детали → уровень детализации.
Пример: Молодой мужчина работает за ноутбуком ночью в маленькой квартире, персонаж сидит за столом в центре кадра, крупный план, свет экрана освещает лицо, кинематографическая фотография, спокойная ночная атмосфера, на столе чашка кофе и блокнот, высокая детализация.
Расширенный кино-фото шаблон
Используется для обложек, рекламных креативов и атмосферных сцен.
Сюжет сцены → композиция → ракурс камеры → тип света → цветовая палитра → материалы и фактуры → художественный стиль → ограничения → визуальные акценты.
Пример: Программист работает за ноутбуком днем. Персонаж сидит за столом в центре кадра, средний план. Камера немного сбоку. Источник света — светящее солнце в окно. Теплая цветовая палитра. Деревянный стол, мягкие тени, лёгкая глубина резкости. Кинематографическая фотография. Без текста и без лишних объектов. Акцент на лице и руках, на которые падают лучи солнца.
Критерий правильного использования шаблонов
Если шаблон помогает быстро собрать понятный промпт без долгого размышления о структуре, значит он выполняет свою задачу.
Шаблоны используются как каркас, который ускоряет работу и снижает количество случайных результатов.
Пример: пять уровней одного запроса
Чтобы увидеть, как структура влияет на изображение, полезно сравнить несколько версий одного и того же запроса.
Возьмём одну и ту же сцену: человек работает за ноутбуком ночью.
Уровень 1 — слабый запрос
Человек работает за ноутбуком.
В этом запросе почти нет информации.
Модель сама решает:
- где происходит сцена
- какой стиль изображения
- какой свет
- какая атмосфера
Поэтому результат обычно случайный.
Уровень 2 — базовое уточнение
Человек работает за ноутбуком ночью.
Появляется время суток, но сцена и стиль всё ещё остаются неопределёнными.
Уровень 3 — простая сцена
Мужчина работает за ноутбуком ночью в комнате, свет экрана освещает лицо.
Теперь появляется:
- окружение
- источник света
Изображение становится более понятным.
Уровень 4 — структурированный промпт
Мужчина работает за ноутбуком ночью в тёмной комнате, сидит за столом, крупный план, свет экрана освещает лицо, реалистичная фотография, спокойная ночная атмосфера.
Здесь уже контролируются:
- композиция
- стиль
- свет
- атмосфера
Картинка становится значительно стабильнее.
Уровень 5 — сильный промпт
Уставший программист работает за ноутбуком глубокой ночью в маленькой квартире. Он сидит за деревянным столом, слегка наклонившись к экрану. Крупный план, камера немного сбоку. Единственный источник света — холодное свечение ноутбука. На столе чашка кофе и блокнот. Кинематографическая фотография, мягкая глубина резкости, тёмная атмосфера ночной работы.
В этом варианте контролируются почти все параметры:
- сюжет
- композиция
- ракурс
- свет
- детали
- стиль
Поэтому результат обычно выглядит как продуманный кадр, а не случайная генерация.
Критерий правильного понимания примера
Если после сравнения видно, что с каждым уровнем изображения становятся более предсказуемыми и осмысленными, значит принцип структуры промпта понят.
Главная идея этого раздела заключается в том, что качество изображения напрямую зависит от структуры запроса. Когда промпт разбит на понятные элементы, пользователь начинает управлять сценой так же, как фотограф или режиссёр управляет кадром.
3. Идеальная структура промпта
В предыдущем разделе разобрано, как модель интерпретирует текст запроса и из каких элементов она собирает изображение. На практике этого недостаточно. Нам нужен простой способ быстро превращать идею картинки в понятный запрос.
Для этого используется структура промпта — заранее заданный порядок элементов, из которых собирается описание сцены. Такая структура снижает случайность генерации и делает результат более предсказуемым.
Сильный промпт обычно не пишется одним сплошным описанием. Он собирается как последовательность визуальных параметров: сначала формируется сцена, затем фиксируется композиция, после этого уточняются стиль, свет и детали.
Ниже показаны две практические формулы: базовая и продвинутая.
Базовая формула
Базовая формула используется для быстрой генерации понятной сцены.
Кто или что → что делает → где → стиль → свет → настроение → ключевые детали
Эта схема помогает задать минимальный набор параметров, необходимый для стабильной генерации изображения.
Например, вместо короткого запроса - человек за ноутбуком - можно использовать базовую формулу: мужчина работает за ноутбуком ночью в небольшой квартире, реалистичная фотография, свет экрана освещает лицо, спокойная ночная атмосфера, на столе чашка кофе и блокнот
Даже такая простая структура уже резко снижает случайность результата, потому что модель получает ясную сцену, стиль и атмосферу.
Проверяемый критерий применения формулы.
Если по тексту запроса можно быстро понять:
— кто находится в сцене
— что происходит
— где происходит действие
— какой характер изображения
значит базовая структура промпта собрана корректно.
Продвинутая формула
Когда требуется более точный визуальный результат, используется расширенная структура запроса.
Сюжет → композиция → ракурс → свет → цвет → фактура → стиль → ограничения → важные акценты
Эта схема ближе к логике постановки кадра в фотографии или кино. Она позволяет управлять не только самой сценой, но и тем, как зритель воспринимает изображение.
Пример такого запроса: уставший программист работает за ноутбуком поздно ночью. Персонаж сидит за столом в центре кадра, средний план, камера немного сбоку. Единственный источник света — холодное свечение ноутбука. Темная синяя цветовая палитра. Деревянный стол, мягкие тени. Кинематографическая фотография. Без текста и без лишних людей. Акцент на лице и руках, освещённых экраном.
В этом случае контролируются сразу несколько важных параметров изображения: композиция кадра, источник света, цветовая атмосфера и точки визуального внимания.
Проверяемый критерий применения формулы.
После генерации изображение выглядит как поставленный кадр: сцена читается сразу, свет и композиция выглядят осмысленно, а внимание концентрируется на нужных элементах.
Три шаблона для копирования
Чтобы не собирать структуру запроса каждый раз вручную, удобно использовать готовые шаблоны. Они работают как каркас, в который подставляется конкретная сцена.
Короткий шаблон
Используется для быстрых генераций.
объект или персонаж, действие, место сцены, стиль изображения, свет, атмосфера, несколько ключевых деталей
Пример: женщина читает книгу у окна, уютная квартира, реалистичная фотография, мягкий вечерний свет, спокойная атмосфера, плед и чашка чая.
Рабочий шаблон
Подходит для большинства практических задач.
Кто или что → действие → где происходит → композиция → свет → стиль → атмосфера → ключевые детали → уровень детализации
Пример: мужчина работает за ноутбуком ночью в квартире, сидит за столом в центре кадра, крупный план, свет экрана освещает лицо, кинематографическая фотография, спокойная атмосфера, на столе чашка кофе и блокнот, высокая детализация.
Расширенный кино‑фото шаблон
Используется для атмосферных сцен, обложек и рекламных визуалов.
Сюжет сцены → композиция → ракурс камеры → тип света → цветовая палитра → материалы и фактуры → художественный стиль → ограничения → визуальные акценты
Пример: уставший программист работает за ноутбуком глубокой ночью. сидит за деревянным столом, средний план, камера немного сбоку. холодный свет экрана освещает лицо. темная синяя цветовая палитра, мягкие тени. кинематографическая фотография. без текста. акцент на лице и руках.
Пример: пять уровней одного запроса
Чтобы увидеть, как структура влияет на результат генерации, полезно сравнить несколько версий одного и того же запроса.
Базовая сцена: человек работает за ноутбуком ночью.
Уровень 1 — слабый запрос
человек работает за ноутбуком
Модель получает минимальную информацию и сама выбирает стиль, сцену и атмосферу.
Уровень 2 — немного конкретики
человек работает за ноутбуком ночью
Добавляется время суток, но сцена остаётся неопределённой.
Уровень 3 — базовая сцена
мужчина работает за ноутбуком ночью в комнате, свет экрана освещает лицо
Появляется окружение и источник света, изображение становится более понятным.
Уровень 4 — структурированный запрос
мужчина работает за ноутбуком ночью в тёмной комнате, сидит за столом, крупный план, свет экрана освещает лицо, реалистичная фотография, спокойная ночная атмосфера
Здесь уже контролируются композиция, стиль и атмосфера сцены.
Уровень 5 — сильный промпт
Уставший программист работает за ноутбуком глубокой ночью в маленькой квартире. Он сидит за деревянным столом, слегка наклонившись к экрану. Крупный план, камера немного сбоку. Единственный источник света — холодное свечение ноутбука. На столе чашка кофе и блокнот. Кинематографическая фотография, мягкая глубина резкости.
Такой запрос описывает не просто объект, а полноценную сцену с композицией, светом и атмосферой.
Ключевая идея раздела заключается в том, что структура промпта превращает генерацию изображений из случайной попытки получить красивую картинку в управляемый процесс создания визуальной сцены.
4. Визуальные параметры
Что такое визуальные параметры и какую задачу они решают
При генерации изображений основная проблема возникает не из‑за нехватки идей, а из‑за хаотичных описаний сцены. Пользователь пытается сразу описать всё изображение и в результате получает длинный, но плохо управляемый запрос.
Практическое решение — использовать визуальные параметры. Это отдельные характеристики сцены, которые позволяют собрать изображение из нескольких управляемых элементов.
Каждый параметр отвечает за конкретную часть будущего изображения: пространство сцены, расположение объектов, положение камеры, освещение, цветовую атмосферу и художественный стиль.
Использование визуальных параметров превращает генерацию изображения в конструктор. Вместо длинного описания пользователь выбирает несколько характеристик и объединяет их в один запрос. В большинстве практических задач достаточно 6–10 параметров, чтобы изображение стало стабильным и предсказуемым.
Важно учитывать связь этого инструмента с предыдущим разделом. Структура промпта задаёт логику описания сцены, а визуальные параметры помогают быстро выбрать конкретные характеристики, которыми эта структура заполняется.
Основные категории визуальных параметров
Ниже приведён набор параметров, который закрывает большинство практических задач генерации изображений.
- Сцена и среда. Пространство, где происходит действие.
Примеры: квартира, офис, уютное кафе, ночная улица, лес, крыша дома, студия.
Этот параметр создаёт контекст изображения и помогает модели понять окружение сцены.
- Композиция кадра. Расположение элементов внутри изображения.
Примеры: герой в центре кадра, герой сбоку, объект на переднем плане, много пустого пространства.
Композиция делает изображение читаемым и управляет тем, куда зритель смотрит в первую очередь.
- Ракурс камеры. Положение камеры относительно сцены.
Примеры: уровень глаз, вид сверху, вид снизу, камера сбоку, вид со спины.
Ракурс меняет эмоциональное восприятие изображения.
- Свет. Тип освещения сцены.
Примеры: мягкий утренний свет, тёплый вечерний свет, неоновый свет, контровой свет, свет экрана.
Освещение формирует атмосферу и глубину изображения.
- Цветовая палитра. Общая цветовая логика сцены.
Примеры: тёплая палитра, холодная палитра, контрастные цвета, пастельные оттенки, монохром.
Цвет задаёт эмоциональный тон изображения.
- Настроение сцены. Эмоциональный характер изображения.
Примеры: спокойствие, тревога, напряжение, надежда, уют, драматическая атмосфера.
Этот параметр усиливает смысл сцены и помогает передать идею изображения.
- Фактуры и материалы. Поверхности объектов.
Примеры: дерево, металл, стекло, бетон, ткань, влажные поверхности.
Фактуры делают сцену более реалистичной и визуально богатой.
- Стиль изображения. Художественный язык картинки.
Примеры: реалистичная фотография, кинематографический кадр, цифровая иллюстрация, комикс, минимализм.
Стиль определяет общий внешний вид изображения.
- Детализация сцены. Уровень сложности изображения.
Примеры: минимализм, средняя детализация, высокая детализация.
Этот параметр регулирует насыщенность кадра деталями.
- Ограничения. Что необходимо исключить из изображения.
Примеры: без текста, без лишних людей, без логотипов, без мультяшности.
Ограничения помогают убрать случайные элементы и удержать чистоту сцены.
Как пользоваться визуальными параметрами
Работа начинается с идеи сцены. После этого из разных категорий выбираются параметры, которые определяют характер изображения.
Использовать все категории одновременно не требуется. В большинстве случаев достаточно шести–десяти параметров, чтобы сцена стала управляемой.
Пример выбора параметров:
- сцена — маленькая квартира
- композиция — персонаж в центре кадра
- ракурс — камера немного сбоку
- свет — холодный свет экрана
- цвет — тёмно‑синяя палитра
- настроение — спокойная ночная работа
- стиль — кинематографическая фотография
- ограничения — без текста
После объединения параметров получается промпт: человек работает за ноутбуком ночью в маленькой квартире, персонаж в центре кадра, камера немного сбоку, холодный свет экрана освещает лицо, тёмно‑синяя цветовая палитра, спокойная атмосфера ночной работы, кинематографическая фотография, без текста
Быстрые микроподсказки для выбора параметров
Сцену лучше формулировать конкретно. Не просто комната, а небольшая тёмная комната или уютное кафе у окна.
Композиция управляет вниманием. Объект в центре усиливает фокус, смещение героя в сторону создаёт ощущение пространства.
Ракурс меняет драматургию кадра. Вид сверху делает сцену наблюдательной, ракурс снизу усиливает драму.
Свет — самый сильный визуальный параметр. Даже простая сцена может выглядеть совершенно по‑разному при утреннем, неоновом или контрастном освещении.
Цветовая палитра формирует эмоцию сцены. Тёплые цвета создают уют, холодные оттенки делают изображение более напряжённым.
Фактуры усиливают реализм. Дерево, стекло и ткань делают сцену визуально богаче.
Стиль лучше фиксировать явно. Если стиль не указан, модель часто выбирает его случайно.
Детализация должна быть умеренной. Несколько точных деталей работают лучше длинного списка мелочей.
Ограничения помогают убрать случайные элементы. Короткая фраза «без текста» или «без лишних людей» часто значительно улучшает результат.
Быстрые наборы визуальных параметров
Ниже приведены готовые комбинации параметров. Их можно использовать как основу для промпта.
Кинематографическая сцена
- композиция — герой в центре кадра
- ракурс — камера немного сбоку
- свет — контровой или драматический
- цвет — тёмная контрастная палитра
- стиль — кинематографическая фотография
Минималистичная обложка
- композиция — один крупный объект
- фон — много пустого пространства
- цвет — ограниченная палитра
- детализация — минимализм
- стиль — чистая графика или фотография
Рекламный визуал
- композиция — объект на переднем плане
- свет — яркий направленный свет
- цвет — контрастная палитра
- детализация — высокая
- ограничения — без лишних объектов
Уютная атмосфера
- сцена — интерьер или дом
- свет — тёплый ламповый свет
- цвет — тёплая палитра
- настроение — спокойствие и комфорт
Тревожная сцена
- свет — резкий контраст света и тени
- цвет — холодная палитра
- ракурс — немного снизу или сбоку
- настроение — напряжение
Документальный кадр
- ракурс — уровень глаз
- композиция — естественная сцена
- свет — естественный дневной свет
- стиль — реалистичная фотография
Драматический кадр
- ракурс — снизу вверх
- свет — контровой свет
- цвет — контрастная палитра
- настроение — напряжённая атмосфера
Иллюстрация для статьи
- композиция — один главный объект
- фон — упрощённая среда
- стиль — цифровая иллюстрация
- детализация — средняя
Атмосферная ночная сцена
- сцена — ночь или тёмное помещение
- свет — неон или свет экрана
- цвет — холодная синяя палитра
- настроение — тихая атмосфера
Символическая сцена
- композиция — один выразительный объект
- фон — минималистичный
- цвет — ограниченная палитра
- настроение — метафорическая атмосфера
Мини‑практика
Чтобы увидеть влияние параметров на результат генерации, полезно собрать одну и ту же сцену в нескольких визуальных вариантах.
Базовый сюжет — человек работает за ноутбуком.
Тёплый вариант - человек работает за ноутбуком вечером в уютном кафе, тёплый ламповый свет, тёплая цветовая палитра, спокойная атмосфера, реалистичная фотография
Холодный вариант - человек работает за ноутбуком ночью в квартире, холодный свет экрана, холодная синяя палитра, тихая ночная атмосфера, реалистичная фотография
Контрастный вариант - человек работает за ноутбуком ночью в тёмной комнате, яркий свет экрана освещает лицо, сильный контраст света и тени, кинематографическая фотография
Проверяемый критерий корректного применения
Если после изменения нескольких параметров — света, цвета или атмосферы — изображение начинает выглядеть совершенно по‑разному, значит визуальные параметры используются правильно и управляют характером сцены.
Смысл этого метода состоит в том, что визуальные параметры позволяют менять характер изображения без полной переписи промпта.
5. Базовые стили, которых хватает для 90% практики
Что такое базовые стили и какую задачу они решают
При генерации изображений стиль определяет визуальный язык картинки. Он влияет на то, выглядит ли изображение как фотография, иллюстрация, кадр из фильма или комикс.
На практике начинающие пользователи часто пытаются использовать десятки разных стилей. В результате визуалы получаются хаотичными, а серия изображений не держит единый характер.
Рабочий подход противоположный. Вместо большого количества случайных стилей используется небольшой базовый набор, который закрывает большинство практических задач: статьи, обложки, иллюстрации, социальные сети и рекламные креативы.
Главная задача этого набора — дать несколько понятных визуальных языков, которыми можно быстро собирать изображения под разные ситуации.
Базовый набор стилей
Ниже приведён набор стилей, который покрывает примерно девяносто процентов практических задач при работе с изображениями.
- Реалистичное фото. Изображение выглядит как настоящая фотография. Подходит для статей, образовательных материалов, социальных сетей и многих рекламных задач.
- Кино‑кадр. Изображение напоминает кадр из фильма: выразительный свет, атмосферная сцена, кинематографическая композиция. Чаще всего используется для эмоциональных обложек и визуалов с драмой.
- Документальный кадр. Максимально естественная сцена без постановочного эффекта. Свет и композиция выглядят так, будто кадр снят в реальной жизни. Такой стиль хорошо работает для иллюстраций в статьях и образовательных материалах.
- Цифровая иллюстрация. Художественная иллюстрация без стремления к фотореализму. Часто используется в блогах, обучающих материалах и медиа.
- Минимализм. Один главный объект, простой фон и ограниченная цветовая палитра. Такой стиль делает изображение очень читаемым. Особенно хорошо подходит для обложек и социальных сетей.
- Предметная сцена. В центре изображения находится объект или набор предметов: ноутбук, телефон, документы, деньги, символические предметы. Используется для иллюстраций идей и рекламных креативов.
- Метафорическая сцена. Изображение передаёт идею через символ или визуальную метафору. Например: человек стоит перед двумя дорогами, разбитая цепь, лестница в небо.
Этот стиль хорошо работает для статей, психологических тем и мотивационных материалов.
- Комикс. Стилизованные персонажи, яркие эмоции, иногда несколько кадров. Используется для объяснения идей, историй и визуальных примеров.
- Мем‑стиль. Простые, иногда намеренно грубые изображения, которые работают на иронию или быстрый эмоциональный эффект. Чаще всего применяется в социальных сетях.
- Рекламный креатив. Яркая сцена с сильным визуальным акцентом, контрастным светом и чётким объектом. Используется для баннеров, обложек и рекламных материалов.
Почему не нужно раздувать список стилей
Для большинства проектов достаточно ограниченного набора визуальных языков. Если каждый раз использовать новый стиль, изображения начинают выглядеть несвязанными.
Гораздо эффективнее выбрать несколько рабочих стилей и научиться адаптировать их под разные задачи.
Например, один и тот же стиль реалистичной фотографии можно использовать для:
— обложек статей
— иллюстраций внутри текста
— рекламных сцен
— визуалов для социальных сетей
Разница будет не в стиле, а в композиции, свете и деталях сцены.
Практический смысл этого подхода в том, что сила генерации изображений находится не в количестве стилей, а в умении управлять одним стилем в разных ситуациях.
Прикладной пример
Возьмём один и тот же сюжет: человек работает за ноутбуком.
Теперь посмотрим, как меняется изображение при смене стиля.
Реалистичное фото - мужчина работает за ноутбуком в небольшой квартире, вечер, мягкий свет лампы, реалистичная фотография.
Кино‑кадр - уставший программист работает за ноутбуком глубокой ночью, тёмная комната, холодный свет экрана освещает лицо, кинематографический кадр.
Цифровая иллюстрация - человек работает за ноутбуком дома, мягкие цвета, упрощённые формы, цифровая иллюстрация.
Минимализм - человек за ноутбуком, один объект на простом фоне, ограниченная цветовая палитра.
Метафорическая сцена - человек сидит за ноутбуком, вокруг темнота, экран освещает лицо, за спиной бесконечная гора задач из документов.
Один и тот же сюжет создаёт совершенно разное визуальное впечатление в зависимости от выбранного стиля.
Проверяемый критерий корректного использования
Если при смене стиля сцена начинает выглядеть как совершенно другой тип изображения — фотография, иллюстрация или кино‑кадр — значит стиль задан корректно и влияет на результат.
Если же изображения почти не отличаются друг от друга, значит стиль описан слишком расплывчато или не закреплён в запросе.
Практика
Возьмите один простой сюжет. Например: человек работает за ноутбуком.
Сгенерируйте шесть–восемь вариантов изображения, каждый раз меняя только стиль.
Например:
— реалистичная фотография
— кино‑кадр
— документальный кадр
— цифровая иллюстрация
— минимализм
— предметная сцена
— метафорическая сцена
— рекламный креатив
После генерации выберите три–четыре стиля, которые лучше всего подходят для ваших задач.
Именно эти стили стоит закрепить как рабочие стили проекта и использовать их для серии изображений.
Практический смысл упражнения состоит в том, чтобы сформировать не случайный набор картинок, а управляемую библиотеку визуальных стилей, которые можно применять повторно.
6. 10 типов промптов, которыми пользуются на практике
Что такое тип промпта и какую задачу он решает
При работе с генерацией изображений одна из частых проблем состоит в том, что каждый новый запрос собирается с нуля. Пользователь формулирует описание сцены заново и тратит время на подбор структуры.
Практическое решение — использовать типовые конструкции промптов. Это готовые логические схемы запросов, которые применяются для определённой задачи: обложка статьи, иллюстрация, персонаж, рекламный визуал или серия изображений.
Тип промпта определяет не только стиль изображения, но и логику сцены: что находится в центре кадра, как расположены элементы и какой эффект должно производить изображение.
Ниже приведены десять типов промптов, которые покрывают большинство практических задач при работе с изображениями.
Как быстро выбрать тип промпта
В реальной работе важно не просто знать типы промптов, а быстро понимать, какой из них использовать.
Если задача — показать реальную жизненную сцену, используется сцена‑фото.
Если нужно эмоциональное или драматичное изображение, лучше подойдёт кино‑кадр.
Если изображение должно выглядеть максимально естественно, используется документальный кадр.
Если нужно объяснить идею или концепцию, лучше использовать редакционную иллюстрацию.
Если требуется простая и быстро читаемая обложка, используется минимализм.
Если изображение делается для статьи или поста без текста внутри картинки, применяется инфо‑обложка.
Если нужно создать героя или аватар, используется тип персонаж.
Если необходимо сделать несколько изображений для одной рубрики, используется серия в одном стиле.
Если нужно показать контраст между двумя состояниями, используется до‑после / split‑screen.
Если смысл изображения передаётся через предметы, используется объектная композиция.
Этот ориентир позволяет выбрать тип промпта за несколько секунд.
1. Сцена‑фото
Когда применять. Когда нужно реалистичное изображение, которое выглядит как фотография из жизни. Такой тип часто используется для иллюстраций в статьях, блогах и образовательных материалах.
Шаблон. Объект или человек + действие + место сцены + композиция + свет + реалистичная фотография
Пример: Мужчина работает за ноутбуком в небольшой квартире вечером, сидит за столом у окна, мягкий тёплый свет лампы освещает лицо, реалистичная фотография.
Типичная ошибка.
Перегружать сцену большим количеством деталей. Для фото‑сцены лучше работать с простой и понятной композицией.
2. Кино‑кадр
Когда применять. Когда изображение должно выглядеть как драматичный кадр из фильма. Часто используется для обложек статей и эмоциональных сцен.
Шаблон. Герой сцены + действие + атмосферная среда + выразительный свет + кинематографическая композиция
Пример: уставший программист работает за ноутбуком глубокой ночью в тёмной комнате, камера немного сбоку, холодный свет экрана освещает лицо, кинематографический кадр.
Типичная ошибка. Писать только слово "кино - кадр" без описания сцены. Без сцены и света эффект кино‑кадра не появляется.
3. Документальный кадр
Когда применять. Когда изображение должно выглядеть максимально естественно и не постановочно.
Шаблон. Жизненная сцена + естественное действие + простая композиция + дневной свет + документальная фотография.
Пример: человек работает за ноутбуком в небольшом кафе днём, естественный свет из окна, обычная рабочая сцена, документальная фотография.
Типичная ошибка. Добавлять слишком художественный свет или драматическую композицию. Документальный кадр должен выглядеть естественно.
4. Иллюстрация редакционная
Когда применять. Когда нужно визуально объяснить идею статьи или концепцию.
Шаблон. Идея сцены + один главный объект или персонаж + упрощённая среда + стиль цифровой иллюстрации.
Пример: иллюстрация: человек работает за ноутбуком дома, вокруг летают иконки задач и документов, мягкие цвета, цифровая иллюстрация.
Типичная ошибка. Пытаться сделать иллюстрацию фотореалистичной. Редакционная иллюстрация должна оставаться условной и понятной.
5. Минимализм
Когда применять. Когда изображение должно быстро считываться и иметь один визуальный акцент.
Шаблон. Один главный объект + простой фон + ограниченная цветовая палитра + минимализм.
Пример: минималистичная сцена: ноутбук на светлом фоне, один объект в центре, ограниченная цветовая палитра.
Типичная ошибка. Добавлять второстепенные элементы. Минимализм работает только при одном визуальном центре.
6. Инфо‑обложка без текста
Когда применять. Когда изображение используется как обложка, а текст добавляется позже в редакторе.
Шаблон. Центральная идея + один выразительный объект или персонаж + чистая композиция + пространство вокруг объекта + без текста.
Пример: человек стоит перед двумя дорогами, одна освещена, другая тёмная, символическая сцена выбора, чистая композиция, без текста.
Типичная ошибка. Слишком сложная сцена. Обложка должна считываться за одну‑две секунды.
7. Персонаж или аватар
Когда применять. Когда нужно создать героя для серии изображений или аватар проекта.
Шаблон. Описание персонажа + возраст + внешность + одежда + поза или действие + фон сцены.
Пример: молодой разработчик в худи работает за ноутбуком, средние тёмные волосы, спокойное выражение лица, современный рабочий стол.
Типичная ошибка. Менять внешний вид персонажа в каждом запросе. Для серии признаки героя должны повторяться.
8. Серия в одном стиле
Когда применять. Когда нужно сделать несколько изображений для одной рубрики или проекта.
Шаблон. Фиксированный стиль + одинаковая композиция + повторяющийся персонаж или объект + меняется только действие или сцена.
Пример: серия изображений в стиле цифровой иллюстрации: один и тот же персонаж работает за ноутбуком дома, в кафе и в офисе.
Типичная ошибка. Одновременно менять стиль, композицию и героя. Это разрушает ощущение серии.
9. До‑после / split‑screen
Когда применять. Когда нужно показать контраст между двумя состояниями: проблема и результат.
Шаблон. Разделённый экран + сцена слева + противоположная сцена справа + контрастная атмосфера.
Пример: разделённый экран: слева человек усталый работает ночью за ноутбуком, справа тот же человек спокойно работает днём в светлом офисе.
Типичная ошибка. Недостаточный контраст между частями изображения. Обе стороны должны выглядеть явно по‑разному.
10. Предметная композиция
Когда применять.
Когда изображение строится вокруг предмета или набора предметов, а не вокруг человека. Такой тип часто используется в иллюстрациях для статей, рекламных сценах и обложках.
Важно различать два близких случая:
— если предметы просто показывают ситуацию (ноутбук, кофе, блокнот на столе) — это предметная композиция;
— если предметы используются как символ идеи (например, разбитая цепь как символ свободы) — это уже ближе к метафорической сцене, которая чаще применяется в иллюстрациях и обложках.
Шаблон.
Один главный предмет или несколько связанных предметов + аккуратная композиция + простой фон + акцентный свет
Пример: на столе лежат ноутбук, блокнот и чашка кофе, аккуратная композиция сверху, мягкий свет, реалистичная фотография.
Типичная ошибка.
Использовать слишком много объектов. Сильная предметная сцена обычно строится вокруг одного главного предмета или небольшой группы предметов.
Проверяемый критерий корректного применения
Если после выбора типа промпта сцена собирается быстрее и изображение сразу соответствует задаче, значит тип промпта выбран правильно.
Практический смысл этого раздела состоит в том, что типовые конструкции позволяют не придумывать структуру запроса каждый раз заново, а быстро использовать готовые схемы для разных задач.
7. Композиция: что держит картинку
Что такое композиция и какую задачу она решает
Композиция определяет, как расположены элементы внутри изображения и куда зритель смотрит в первую очередь.
Если композиция слабая, даже красивый стиль и хороший свет не спасают изображение. Взгляд рассеивается, смысл сцены читается плохо и картинка не работает как обложка или иллюстрация.
Практическая задача композиции — сразу направить внимание зрителя на главный элемент сцены. Когда композиция собрана правильно, изображение читается за одну–две секунды.
Базовые правила композиции без теории
В генерации изображений чаще всего используются несколько простых принципов.
Центр внимания. В каждой сцене должен быть один главный объект. Если главных элементов несколько, изображение становится хаотичным.
Пустое пространство. Свободная часть кадра помогает выделить главный объект. Это особенно важно для обложек и изображений в социальных сетях.
Крупный объект. Большой объект в кадре читается быстрее, чем множество мелких деталей.
Баланс сцены. Элементы изображения должны выглядеть устойчиво. Если один край кадра перегружен, картинка кажется визуально тяжёлой.
Простота. Чем проще композиция, тем быстрее считывается идея изображения.
Шаблоны композиций
Ниже приведены несколько рабочих схем, которые часто используются при генерации изображений.
Герой в центре. Главный персонаж или объект расположен в центре кадра. Это самая простая и читаемая композиция.
Герой сбоку. Персонаж смещён в левую или правую часть кадра. Свободная часть изображения создаёт ощущение пространства.
Объект на переднем плане. Главный объект расположен близко к камере, а фон остаётся второстепенным.
Вид со спины. Зритель смотрит на персонажа со спины, что создаёт ощущение наблюдения за сценой.
Руки в кадре. В кадре видны руки человека, взаимодействующие с объектом: ноутбуком, телефоном, документами.
Пространство под текст. Главный объект смещён вниз или в сторону, а часть кадра остаётся свободной для будущего текста.
Быстрые практические подсказки
Если изображение используется как обложка, главный объект лучше делать крупным и размещать ближе к центру.
Если изображение должно выглядеть динамично, персонажа можно сместить в сторону кадра.
Если сцена должна выглядеть естественно, хорошо работает композиция с руками или видом со спины.
Если планируется добавление текста, нужно оставить свободное пространство в кадре.
Прикладной пример
Возьмём один сюжет: человек работает за ноутбуком.
Теперь посмотрим, как меняется изображение при разных композициях.
Композиция 1 — герой в центре.
Человек работает за ноутбуком, сидит за столом в центре кадра, крупный объект, реалистичная фотография
Композиция 2 — герой сбоку.
Человек работает за ноутбуком, персонаж смещён в левую часть кадра, справа много свободного пространства, реалистичная фотография
Композиция 3 — руки в кадре.
Вид сверху на руки человека, печатающего на ноутбуке, на столе блокнот и чашка кофе, реалистичная фотография
Проверяемый критерий корректной композиции
Если при первом взгляде на изображение сразу понятно, что является главным объектом, значит композиция работает правильно.
Если взгляд начинает блуждать по картинке и не понятно, где центр внимания, композицию нужно упрощать.
Практика
Выберите простой сюжет. Например: человек работает за ноутбуком.
Сгенерируйте три версии изображения, меняя только композицию:
— герой в центре
— герой сбоку
— руки в кадре
После генерации выберите вариант, в котором смысл сцены читается быстрее всего. Именно такая композиция лучше всего подходит для обложек и иллюстраций.
8. Ракурс и «камера»: как управлять впечатлением
Что такое ракурс и какую задачу он решает
Ракурс определяет откуда зритель смотрит на сцену. Даже при одинаковой композиции и сюжете изменение положения камеры может полностью поменять впечатление от изображения.
Практическая задача ракурса — усилить нужное ощущение сцены: сделать её более драматичной, более наблюдательной или более естественной.
Во многих случаях изменение ракурса даёт более сильный эффект, чем добавление новых деталей в сцену.
Планы кадра
План показывает, насколько близко камера находится к объекту.
Крупный план. В кадре находится лицо человека или крупная часть объекта. Такой план усиливает эмоцию и концентрирует внимание на главной детали.
Средний план. Видна фигура человека или основной объект вместе с частью окружения. Это самый универсальный вариант для большинства сцен.
Общий план. В кадре видна вся сцена: персонаж и пространство вокруг. Такой план хорошо показывает контекст.
Углы камеры
Угол камеры определяет, под каким наклоном зритель смотрит на сцену.
Сверху. Камера смотрит вниз на объект. Такой ракурс создаёт ощущение наблюдения или дистанции.
Снизу. Камера направлена вверх. Объект выглядит более значительным и драматичным.
На уровне глаз. Камера находится на уровне персонажа. Этот ракурс выглядит максимально естественно.
Со спины. Зритель смотрит на сцену из-за спины персонажа. Такой ракурс создаёт ощущение присутствия внутри сцены.
Сбоку. Камера расположена сбоку от объекта. Часто используется для динамичных сцен.
Быстрые практические подсказки
- Если нужно усилить эмоцию персонажа, используйте крупный план.
- Если важно показать контекст сцены, лучше использовать общий план.
- Если нужно сделать сцену более драматичной, хорошо работает ракурс снизу.
- Если изображение должно выглядеть естественно, чаще всего используется уровень глаз.
- Если нужно создать эффект присутствия, помогает ракурс со спины.
Прикладной пример
Возьмём один сюжет: человек работает за ноутбуком.
Теперь посмотрим, как меняется впечатление при разных ракурсах.
Крупный план. Крупный план лица человека, освещённого экраном ноутбука, ночная работа
Средний план. Человек сидит за столом и работает за ноутбуком, средний план, видна часть комнаты
Общий план. Человек работает за ноутбуком в небольшой квартире, общий план, видна вся сцена
Ракурс сверху. Вид сверху на человека, работающего за ноутбуком за столом
Ракурс снизу. Камера снизу смотрит на человека, работающего за ноутбуком
Ракурс со спины. Вид со спины на человека, который работает за ноутбуком перед окном
Проверяемый критерий правильного выбора ракурса
Если после изменения ракурса меняется эмоциональное ощущение сцены, значит ракурс используется правильно.
Если изображение выглядит почти одинаково при разных ракурсах, значит ракурс в запросе описан слишком расплывчато.
Практика
Выберите один простой сюжет. Например: человек работает за ноутбуком.
Сгенерируйте шесть вариантов изображения, меняя только ракурс:
— крупный план
— средний план
— общий план
— вид сверху
— ракурс снизу
— вид со спины
После генерации сравните изображения и определите:
— где эмоция выглядит сильнее
— где сцена читается быстрее
— какой ракурс лучше подходит для обложки или иллюстрации.
9. Свет и атмосфера: быстрый рычаг качества
Что такое свет и атмосферу какую задачу они решают
Свет — один из самых сильных параметров изображения. Даже простая сцена может выглядеть совершенно по-разному в зависимости от освещения и атмосферных условий.
На практике изменение света часто даёт более сильный эффект, чем добавление новых объектов или деталей. Один и тот же сюжет может выглядеть уютным, тревожным или драматичным только за счёт света.
Поэтому свет и атмосферу удобно рассматривать как быстрый рычаг управления качеством изображения. Иногда достаточно изменить освещение сцены, чтобы картинка стала намного выразительнее.
Рабочий набор света
Ниже приведён набор типов освещения, которые чаще всего используются при генерации изображений.
Утренний свет. Мягкое освещение, создающее ощущение свежести и начала дня.
Тёплый вечерний свет. Ламповое или закатное освещение. Часто используется для уютных сцен.
Контровой свет. Источник света находится за объектом. Такой свет создаёт сильный силуэт и драматичный эффект.
Неоновый свет. Яркие цветные источники света. Хорошо работает для ночных городских сцен.
Пасмурный день. Мягкий рассеянный свет без резких теней. Делает сцену спокойной и естественной.
Дождь. Влажная атмосфера, отражения на поверхностях, мягкий рассеянный свет.
Туман. Размытая атмосфера, мягкие контуры объектов.
Отражения. Свет отражается в стекле, воде или мокрых поверхностях.
Световые лучи. Луч света проходит через окно, туман или пыль в воздухе.
Быстрые практические комбинации света
Чтобы быстрее получать выразительные сцены, удобно использовать готовые комбинации света и атмосферы.
Уютная сцена: тёплый вечерний свет + мягкие тени + спокойная атмосфера.
Драматичная сцена: контровой свет + сильный контраст света и тени.
Ночная городская сцена: неоновый свет + отражения на мокром асфальте.
Спокойная повседневная сцена: пасмурный дневной свет + мягкое освещение.
Атмосферная сцена: туман + световые лучи.
Типичные ошибки при работе со светом
Ошибка 1. Слишком много источников света.
Когда в сцене одновременно описано несколько разных источников освещения, модель может создать хаотичный результат.
Ошибка 2. Свет описан слишком абстрактно.
Фразы вроде "красивый свет" или "интересное освещение" не дают модели конкретных ориентиров.
Ошибка 3. Свет не связан с атмосферой сцены.
Например, спокойная сцена может плохо сочетаться с агрессивным контрастным освещением.
Прикладной пример
Возьмём один сюжет: человек работает за ноутбуком.
Теперь изменим только атмосферу сцены.
Спокойная атмосфера: человек работает за ноутбуком вечером в комнате, мягкий тёплый свет лампы, спокойная рабочая атмосфера, реалистичная фотография
Тревожная атмосфера: человек работает за ноутбуком ночью в тёмной комнате, холодный свет экрана освещает лицо, сильный контраст света и тени, напряжённая атмосфера
Атмосфера надежды: человек работает за ноутбуком утром у окна, мягкий утренний свет, световые лучи проходят через окно, спокойная вдохновляющая атмосфера
Проверяемый критерий корректного использования
Если при изменении света полностью меняется настроение сцены, значит свет используется правильно.
Если изображения выглядят почти одинаково, значит освещение описано слишком слабо.
Практика
Возьмите один простой сюжет. Например: человек работает за ноутбуком.
Сгенерируйте три варианта изображения, меняя только атмосферу:
— спокойствие
— тревога
— надежда
После генерации посмотрите:
— где атмосфера ощущается сильнее
— какой вариант лучше подходит для обложки или иллюстрации.
10. Детали, которые усиливают, а не ломают
Что такое детали и какую задачу они решают
Детали помогают сделать сцену более понятной и живой. Они уточняют персонажа, пространство и время действия. Без деталей изображение часто выглядит слишком общим и абстрактным.
Но у деталей есть обратная сторона. Если их слишком много, сцена становится перегруженной. Модель начинает случайно интерпретировать часть описания, и изображение теряет читаемость.
Практическая задача деталей — усилить основную идею сцены, а не заменить её. Детали должны помогать зрителю быстрее понять ситуацию.
Какие детали реально усиливают сцену
На практике лучше всего работают несколько типов деталей.
Возраст и внешний вид персонажа. Молодой мужчина, пожилой профессор, подросток, деловой человек.
Такая деталь помогает модели точнее собрать образ персонажа.
Одежда. Худи, деловой костюм, зимняя куртка, домашняя одежда.
Одежда усиливает характер сцены и делает персонажа более конкретным.
Предметы. Ноутбук, чашка кофе, документы, телефон.
Предметы показывают, что происходит в сцене.
Интерьер или место. Маленькая квартира, современный офис, уютное кафе, библиотека.
Это помогает модели правильно построить пространство сцены.
Сезон или время года. Зимний вечер, осенний парк, летний день.
Такие детали добавляют атмосферу и контекст.
Город или среда. Европейская улица, мегаполис, тихий пригород.
Материалы и поверхности. Деревянный стол, стеклянная витрина, бетонная стена.
Эпоха. Современность, 90‑е годы, футуристическое будущее.
Эти типы деталей чаще всего усиливают сцену, а не перегружают её.
Как не перегружать изображение
Самый простой способ контролировать детали — использовать правило трёх–пяти якорей.
Якорь — это конкретная деталь, которая помогает собрать сцену.
Например:
— ноутбук
— чашка кофе
— деревянный стол
— вечерний свет
— маленькая квартира
Если таких элементов больше пяти, сцена часто начинает перегружаться.
Быстрый алгоритм добавления деталей
Чтобы детали действительно усиливали изображение, удобно использовать простой порядок добавления.
- Сначала формируется основная сцена.
- Затем добавляется 2–3 ключевых предмета, которые объясняют действие.
- После этого можно добавить 1–2 атмосферных детали: сезон, материал, свет.
Такой порядок позволяет усилить сцену, не перегружая её.
Прикладной пример
Возьмём один сюжет: человек работает за ноутбуком.
Простая версия сцены: человек работает за ноутбуком.
Умеренно детализированная сцена: молодой мужчина работает за ноутбуком вечером в маленькой квартире, сидит за деревянным столом, рядом чашка кофе, мягкий свет лампы, реалистичная фотография.
Во втором варианте добавлены несколько якорей: возраст, место, предметы и свет. Сцена становится значительно понятнее.
Типичная ошибка
Частая ошибка — пытаться описать слишком много элементов сразу.
Например: человек работает за ноутбуком ночью в квартире, на столе много документов, книги, телефон, на стене картины, на окне растения, на полу ковёр
В такой сцене внимание рассеивается, и изображение может получиться хаотичным.
Проверяемый критерий
Если после добавления нескольких деталей сцена стала понятнее, значит детали работают правильно.
Если изображение стало перегруженным и взгляд не понимает, на что смотреть, деталей слишком много.
Практика
Возьмите простой сюжет. Например: человек работает за ноутбуком.
Сгенерируйте два варианта изображения:
— простая сцена без деталей
— сцена с 3–5 якорными деталями
После генерации сравните:
— где сцена читается быстрее
— где смысл изображения понятнее
Такое сравнение помогает почувствовать баланс между простотой и деталями.
11. Итерации: как доводить картинку до нужной
Что такое итерации и какую задачу они решают
Генерация изображений почти никогда не даёт идеальный результат с первой попытки. Первая генерация обычно является черновиком, который показывает направление сцены.
Поэтому практическая работа с изображениями строится через итерации — последовательные уточнения запроса, которые постепенно улучшают результат.
Главная задача итераций — не генерировать случайные новые картинки, а постепенно исправлять конкретные проблемы изображения.
Базовый цикл итераций
В практической работе удобно использовать простой цикл из четырёх шагов.
1. Получить черновик. Сначала генерируется базовое изображение, которое показывает сцену, композицию и стиль.
2. Найти три проблемы. После генерации важно не писать новый запрос сразу. Сначала нужно внимательно посмотреть на изображение и назвать несколько конкретных проблем.
Например:
— герой слишком маленький
— фон перегружен
— свет слишком тёмный
3. Уточнить запрос. Следующий запрос должен исправлять именно найденные проблемы.
Например: увеличить героя, упростить фон, сделать сцену светлее
4. Повторить цикл.
После новой генерации снова определяется несколько проблем и вносится уточнение.
Так изображение постепенно становится точнее.
Быстрый принцип трёх проблем
Чтобы итерации были управляемыми, удобно использовать правило трёх проблем.
После каждой генерации называются не больше трёх изменений, которые нужно сделать.
Если пытаться исправить десять вещей сразу, модель часто начинает менять сцену слишком сильно.
Поэтому лучше исправлять изображение постепенно.
Словарь быстрых правок
Чтобы быстрее формулировать уточнения, удобно использовать короткие команды.
Свет и атмосфера
- сделать светлее
- сделать темнее
- усилить контраст
- добавить драматичный свет
Композиция
- увеличить героя
- сместить героя в центр
- переместить героя в левую часть кадра
- упростить фон
Детали
- убрать лишние предметы
- добавить один объект
- сделать сцену минималистичнее
Эмоция и стиль
- сделать сцену реалистичнее
- усилить эмоцию
- сделать атмосферу спокойнее
Быстрый шаблон правки
Чтобы не придумывать формулировку каждый раз заново, можно использовать простой шаблон уточнения.
сохрани основную сцену, но: + список правок
Например: сохрани сцену человека за ноутбуком, но увеличь героя, упрости фон и сделай свет теплее
Так модель понимает, что нужно доработать изображение, а не полностью изменить сцену.
Прикладной пример
Сюжет: человек работает за ноутбуком.
Итерация 1 — базовая сцена
Человек работает за ноутбуком вечером в комнате
Итерация 2 — уточнение композиции
Сохрани сцену, но сделай героя крупнее и упрости фон
Итерация 3 — уточнение света
Сохрани сцену, добавь тёплый вечерний свет лампы и мягкие тени
Итерация 4 — финальная доработка
Сохрани сцену, усили контраст и добавь чашку кофе на стол
Проверяемый критерий корректной работы
Если каждая новая генерация решает конкретную проблему предыдущего изображения, значит итерации используются правильно.
Если каждое новое изображение выглядит как совершенно другая сцена, значит запрос переписывается слишком сильно.
Практика
Возьмите один простой сюжет. Например: человек работает за ноутбуком.
Сделайте четыре генерации подряд, каждый раз улучшая изображение через итерации:
— первая генерация — базовая сцена
— вторая — исправление композиции
— третья — исправление света
— четвёртая — финальные детали
После этого сравните первую и последнюю версию изображения. Обычно разница оказывается очень заметной, даже если изменения были небольшими.
12. Редактирование готовых картинок в ChatGPT
Что такое редактирование изображений и какую задачу оно решает
После генерации изображения не всегда нужно создавать новую сцену с нуля. Часто гораздо быстрее доработать уже существующую картинку.
Редактирование позволяет сохранить удачную часть изображения и изменить только проблемные элементы. Это экономит генерации и делает процесс более управляемым.
Практическая задача редактирования — улучшить изображение без полной пересборки сцены.
Что можно делать с готовым изображением
В большинстве случаев изображение можно использовать как основу и вносить локальные изменения.
Дорабатывать сцену. Например, усилить свет, изменить атмосферу или добавить несколько деталей.
Менять часть сцены. Можно изменить фон, одежду персонажа или предмет в кадре.
Убирать элементы. Часто в генерации появляются лишние предметы или ошибки — их можно удалить.
Добавлять элементы. Можно добавить предмет на стол, изменить интерьер или дорисовать часть сцены.
Исправлять ошибки генерации. Например, лишние пальцы, странные руки или искажённые предметы.
Менять стиль изображения. Иногда сцену можно оставить прежней, но изменить художественный стиль.
Делать вариации изображения. Одна удачная сцена может стать основой для нескольких вариантов.
Как правильно ставить задачу на редактирование
Чтобы редактирование работало предсказуемо, важно чётко разделять три типа указаний.
1. Что нужно сохранить.
Например: сохранить героя, композицию и основную сцену.
2. Что нужно изменить.
Например: изменить фон или сделать свет теплее.
3. Что нельзя менять.
Например: не менять стиль изображения или не трогать персонажа.
Такой формат помогает модели понять, какая часть изображения остаётся неизменной.
Шаблон запроса для редактирования
Чтобы не формулировать запрос каждый раз заново, удобно использовать простой шаблон.
- сохрани + что оставить
- измени + что нужно изменить
- не меняй + что нельзя трогать
Пример запроса: сохрани героя и композицию, измени фон на ночной город и сделай свет неоновым, не меняй стиль изображения.
Типовые команды редактирования
Ниже приведены команды, которые чаще всего используются при доработке изображений.
Удаление и очистка
- убери лишний предмет
- убери лишнего человека
- очисти фон
Изменение сцены
- измени фон
- передвинь объект
- смести героя в центр
Работа со светом
- сделай свет теплее
- сделай сцену темнее
- усиль контраст
Изменение персонажа
- замени одежду
- исправь руки
- измени выражение лица
Доработка кадра
- дорисуй верхнюю часть кадра
- расширь фон
- добавь один предмет
Быстрые практические сценарии редактирования
Чтобы быстрее применять редактирование на практике, можно использовать несколько типовых сценариев.
Очистка сцены. Сохрани героя, убери лишние предметы и упрости фон.
Замена фона. Сохрани героя и композицию, измени фон на городской ночной пейзаж.
Исправление ошибок генерации. Сохрани сцену, исправь руки и убери лишние элементы.
Усиление атмосферы. Сохрани сцену, сделай свет контрастнее и добавь атмосферу дождя.
Проверяемый критерий корректного редактирования
Если после правки основная сцена остаётся узнаваемой, а изменяется только нужная часть изображения, значит редактирование выполнено правильно.
Если сцена полностью меняется, значит запрос слишком сильно переписывает изображение.
Практика
Возьмите одну сгенерированную картинку.
Сделайте пять вариантов редактирования, не пересобирая сцену:
— убрать лишний предмет
— изменить фон
— сделать свет теплее
— заменить персонажа
— дорисовать часть кадра
После этого сравните изображения и посмотрите, какие изменения дают самый заметный эффект.
13. Работа по референсу: как повторять стиль без хаоса
Что такое референс и какую задачу он решает
Референс — это изображение, которое используется как ориентир для генерации новой картинки. Это может быть фотография, иллюстрация, комикс, мем, скриншот, собственная фотография или ранее созданная удачная работа.
Использование референса позволяет не описывать стиль длинным текстом. Модель уже видит визуальный пример и может ориентироваться на него при генерации.
Практическая задача референса — зафиксировать визуальный язык изображения: стиль, атмосферу, композицию и характер сцены.
Как использовать референсы
В интерфейсе ChatGPT изображение можно просто закинуть в диалог.
В качестве референса можно использовать:
— фотографию
— иллюстрацию
— комикс
— мем
— свою фотографию
— ранее созданную удачную картинку
После прикрепления изображения в запросе нужно описать, что именно из референса нужно использовать.
Что можно переносить из референса
Референс может передавать разные элементы изображения. Важно указывать их явно.
Стиль изображения. Стиль комикса, стиль цифровой иллюстрации, фотореализм.
Атмосферу. мрачная сцена, уютная атмосфера, неоновая ночь.
Композицию. Герой в центре кадра или объект на переднем плане.
Цветовую палитру. Холодные синие оттенки или тёплая пастельная палитра.
Характер линий или графики. Грубые линии комикса или мягкая иллюстрация.
Общий визуальный язык. То есть общий характер изображения.
Что обязательно уточнять
Чтобы генерация не копировала референс полностью, важно уточнять что переносится, а что меняется.
Например:
— использовать стиль изображения
— изменить героя
— изменить фон
— поменять эмоцию персонажа
— изменить позу
Такой подход помогает избежать ситуации, когда модель просто повторяет исходную сцену.
Быстрый шаблон работы с референсом
Чтобы работать с референсами быстрее, можно использовать простой шаблон.
Используй стиль и атмосферу референса, но измени + что должно отличаться
Пример: используй стиль иллюстрации из референса, но измени героя на человека за ноутбуком и сделай сцену в кафе
Типичные ошибки при работе с референсами
Ошибка 1. Не указано, что именно переносится.
Если написать просто «сделай как на картинке», модель может выбрать случайные элементы.
Ошибка 2. Попытка перенести всё сразу.
Когда одновременно копируются стиль, композиция, персонаж и сцена, изображение становится почти копией.
Ошибка 3. Слишком сильное изменение сцены.
Если изменить сразу всё, референс перестаёт влиять на результат.
Прикладной пример
Сюжет: человек работает за ноутбуком.
Вариант 1 — без референса: человек работает за ноутбуком в комнате, вечерний свет, реалистичная фотография
Вариант 2 — по стилю референса: используй стиль иллюстрации из референса, человек работает за ноутбуком в комнате, мягкая цветовая палитра
Вариант 3 — по своей старой удачной картинке: используй стиль и композицию прикреплённой картинки, но измени сцену: человек работает за ноутбуком в кафе
Проверяемый критерий корректной работы
Если новая картинка визуально напоминает стиль референса, но сцена остаётся новой, значит референс используется правильно.
Если изображение выглядит почти как копия исходной картинки, значит слишком много элементов перенесено без изменений.
Практика
Возьмите один сюжет. Например: человек работает за ноутбуком.
Сделайте три варианта изображения:
— без референса
— по стилю прикреплённого изображения
— по своей старой удачной картинке
После генерации сравните результаты и посмотрите, как меняется стабильность стиля при использовании референсов.
14. Негативные указания: как запретить лишнее
Что такое негативные указания и какую задачу они решают
При генерации изображений модель иногда добавляет элементы, которых пользователь не просил: лишних людей, случайные предметы, текст на картинке или перегруженный фон.
Негативные указания — это прямые запреты в запросе, которые помогают убрать нежелательные элементы.
Практическая задача негативных указаний — очистить сцену и удержать изображение в нужном стиле.
Вместо того чтобы переписывать весь промпт, часто достаточно добавить несколько запретов.
Когда негативные указания работают лучше всего
Негативные указания особенно полезны в нескольких ситуациях.
Очистка сцены. Когда в кадре появляются случайные предметы или перегруженный фон.
Удаление текста. Генераторы изображений часто делают ошибки в тексте, поэтому для обложек лучше сразу писать запрет.
Контроль количества людей. Иногда модель добавляет дополнительных персонажей.
Удержание реалистичного стиля. Если сцена начинает выглядеть мультяшно или иллюстративно.
Устранение технических ошибок. Например, искажённые лица или лишние детали.
Рабочие шаблоны запретов
Ниже приведены запреты, которые чаще всего используются на практике.
Очистка сцены
- без лишних предметов
- без перегруженного фона
- без визуального мусора
Удаление текста
- без текста
- без надписей
- без логотипов
Контроль персонажей
- без дополнительных людей
- один человек в кадре
Контроль стиля
- без мультяшности
- без комикс-стиля
Исправление типичных ошибок генерации
- без искажений лица
- без лишних пальцев
Быстрый принцип работы с запретами
Негативные указания лучше использовать точечно.
Если добавить слишком много запретов, модель может начать игнорировать часть запроса.
На практике чаще всего достаточно 2–4 запретов, чтобы очистить изображение.
Прикладной пример
Сюжет: человек работает за ноутбуком.
Базовый вариант: человек работает за ноутбуком ночью в комнате, холодный свет экрана.
Вариант с негативными указаниями: человек работает за ноутбуком ночью в комнате, холодный свет экрана, без текста, без лишних людей, без перегруженного фона.
После добавления запретов сцена становится чище и более читаемым.
Типичная ошибка
Частая ошибка — добавлять длинный список запретов без реальной необходимости.
Например: без текста, без логотипов, без людей, без животных, без объектов, без деталей.
В таком случае модель получает противоречивый запрос и может ухудшить результат.
Проверяемый критерий
Если после добавления нескольких запретов изображение становится чище и проще, значит негативные указания работают правильно.
Если изображение становится странным или слишком пустым, запретов слишком много.
Практика
Сгенерируйте одну сцену: человек работает за ноутбуком.
Сделайте два варианта изображения:
— базовый запрос без запретов
— тот же запрос, но с 2–3 негативными указаниями
После генерации сравните:
— стало ли изображение чище
— исчезли ли лишние элементы
— стало ли проще читать сцену.
15. Диагностика проблем: почему получается не то
Что такое диагностика и какую задачу она решает
Даже при хорошем промпте изображение иногда получается слабым: сцена непонятна, стиль случайный, композиция разваливается или картинка просто не работает как обложка.
В таких случаях важно не генерировать новые изображения случайно, а диагностировать проблему. Практический подход — определить симптом, понять причину и внести конкретное изменение в запрос.
Ниже приведены типовые проблемы генерации изображений и способы их исправления.
Блок A. Непонятный сюжет
Симптом. Картинка выглядит хаотично. Неясно, что происходит в сцене.
Причина. В промпте отсутствует чёткая сцена: нет понятного действия или окружения.
Что поменять. Добавить структуру сцены: персонаж → действие → место.
Пример. Проблемный запрос: человек и компьютер
Исправленный запрос: человек работает за ноутбуком в небольшой квартире вечером, сидит за столом у окна.
Блок B. Случайный стиль
Симптом. Каждая генерация выглядит в разном стиле: то иллюстрация, то фотография, то мультяшная картинка.
Причина. Стиль не зафиксирован в запросе.
Что поменять. Явно указать художественный стиль.
Пример: человек работает за ноутбуком, реалистичная фотография.
Блок C. Плохая композиция
Симптом. Главный объект слишком маленький или теряется на фоне.
Причина. В промпте не указана композиция.
Что поменять. Добавить положение объекта в кадре.
Пример: человек работает за ноутбуком, персонаж в центре кадра, крупный план.
Блок D. Люди и позы
Симптом. Неестественные руки, странные позы или лишние пальцы.
Причина. Слишком сложная поза или недостаточно описано действие.
Что поменять. Упростить действие и добавить конкретное описание позы.
Пример: человек сидит за столом и печатает на ноутбуке, руки на клавиатуре.
Блок E. Свет и цвет
Симптом. Изображение выглядит плоским или визуально скучным.
Причина. В запросе не указан тип света.
Что поменять. Добавить источник света или атмосферу.
Пример: человек работает за ноутбуком ночью, холодный свет экрана освещает лицо.
Блок F. Лишние детали и неправильная среда
Симптом. В сцене появляются предметы не из той эпохи, страны или интерьера.
Причина. Среда сцены описана слишком абстрактно.
Что поменять. Уточнить место, эпоху или стиль интерьера.
Пример: человек работает за ноутбуком в современном минималистичном офисе.
Блок G. Картинка хорошая, но не под задачу
Симптом. Изображение красивое, но не работает как обложка: не цепляет и плохо читается.
Причина. Слишком сложная сцена или нет одного главного объекта.
Что поменять. Упростить композицию и сделать главный объект крупнее.
Пример: человек с ноутбуком в центре кадра, крупный объект, простой фон.
Проверяемый критерий
Если после изменения одного параметра (сюжет, стиль, композиция или свет) изображение становится заметно лучше, значит диагностика проведена правильно.
Смысл диагностики состоит в том, чтобы исправлять конкретную проблему, а не переписывать весь промпт.
16. Серии изображений: как делать картинки в одном стиле
Зачем нужны серии изображений
Когда изображения создаются для канала, блога или рубрики, важно чтобы они выглядели как единая визуальная система. Если стиль постоянно меняется, проект выглядит хаотично.
Серия изображений решает эту задачу. Она формирует узнаваемый визуальный язык, который повторяется от картинки к картинке.
Как фиксировать стиль серии
Практический способ удерживать единый стиль — использовать три элемента.
Мастер‑промпт. Базовый запрос, который задаёт стиль серии.
Постоянные параметры. Элементы, которые не меняются: стиль изображения, тип света, композиция, цветовая палитра.
Переменные элементы. То, что меняется от изображения к изображению: действие персонажа, место сцены или предмет.
Пример структуры серии
Мастер‑промпт: цифровая иллюстрация, минималистичный стиль, мягкая цветовая палитра, женщина работает за ноутбуком
Постоянные параметры:
— стиль иллюстрации
— мягкий свет
— персонаж
Переменные параметры:
— место сцены
— действие
— детали
Как удерживать одного героя
Чтобы персонаж выглядел одинаково в серии, важно повторять ключевые признаки.
Например:
— возраст персонажа
— внешность
— одежда
— эмоция
— стиль изображения
Дополнительно можно прикладывать удачную картинку из серии как референс. Это помогает модели удерживать внешний вид героя.
Быстрый шаблон серии
Сохрани стиль предыдущего изображения, тот же персонаж, та же цветовая палитра, измени только сцену.
Практика
Выберите одну тему рубрики. Например: работа за компьютером.
Сделайте серию из шести изображений, меняя только сцену:
— дома
— в кафе
— в офисе
— ночью
— утром
— в поездке
После генерации проверьте, выглядят ли изображения как одна визуальная серия.
Если стиль, персонаж и атмосфера повторяются, серия работает правильно.
17. Комиксы и мем‑картинки в ChatGPT
Что это такое и какую задачу решает формат
Комиксы и мем‑картинки позволяют передавать идею быстрее, чем обычная иллюстрация. Несколько кадров или один мем‑кадр могут показать конфликт, шутку или объяснение сложной мысли.
Этот формат особенно хорошо работает для:
— социальных сетей
— обучающих материалов
— объяснения сложных идей
— ироничных комментариев к теме
Практическая задача комиксов и мемов — показать идею через короткую визуальную историю.
Что можно делать в ChatGPT
С помощью генерации изображений можно создавать:
— комиксы на русском и английском
— мемы со своим текстом
— иллюстрации для уроков и курсов
— мини‑истории из нескольких кадров
— реакционные мем‑сцены
Чаще всего используются комиксы из 2–4 кадров или одиночные мем‑картинки.
Два способа создания комикса
Есть два практических способа работы.
Способ 1. Сначала сценарий, потом изображение.
Сначала просим модель придумать структуру комикса.
Пример запроса: придумай короткий комикс из четырёх кадров про человека, который пытается работать, но его постоянно отвлекает телефон.
После этого можно попросить сгенерировать изображение по этой раскладке. Кстати, Чат ГПТ порой делает 2 варианта картинок, чтобы я выбрал лучшую. Как сейчас. Но я выбрал две)
Способ 2. Сразу готовый комикс.
Можно сразу описать сцену.
Пример: комикс из четырёх кадров: человек садится работать за ноутбуком, затем проверяет телефон, затем зависает в соцсетях, последний кадр — ночь и он всё ещё листает телефон.
Этот способ быстрее, но первый даёт более продуманную структуру.
Что ChatGPT может придумать сам
Модель может автоматически предложить:
— разбивку на кадры
— короткие реплики
— подписи
— звуковые эффекты
— визуальные акценты
Например: "бип", "дзынь", "уведомление".
Как дорабатывать комиксы
После генерации комикс почти всегда можно улучшить.
Чаще всего правят:
— текст в репликах
— расположение персонажей
— количество кадров
— выражение эмоций
— ошибки генерации (руки, повторяющиеся лица)
Можно просить перерисовать только один кадр, не меняя остальные.
Как делать персонажа из фотографии
Если нужен узнаваемый герой, можно использовать фотографию.
Для этого:
- Прикрепить изображение.
- Попросить модель создать персонажа в стиле комикса.
Пример: сделай комикс‑персонажа на основе этой фотографии, стиль простой комикс, выразительные эмоции.
Так можно создавать героев для обучающих или развлекательных серий.
Как удерживать стиль комикса
Когда появляется удачный результат, лучше сохранить его как ориентир.
Самый простой способ — использовать удачную картинку как референс.
В следующем запросе можно написать: сохрани стиль прикреплённого комикса и сделай новую сцену.
Это помогает удерживать одинаковый визуальный язык серии.
Быстрый шаблон промпта для комикса
Комикс из 4 кадров, простой комикс‑стиль, один персонаж, короткие подписи, чёткие эмоции
Практика
Сделайте два задания.
- Создайте комикс из четырёх кадров на любую бытовую тему.
- Сделайте мем‑картинку, где меняется только текст, но сохраняется та же сцена.
Сравните, какой формат лучше передаёт идею.
18. Адаптации, мем‑сцены и визуалы по известным шаблонам
Что такое адаптации и зачем они нужны
Адаптация — это использование узнаваемой сцены или визуальной конструкции, но с новым смыслом.
Такие изображения работают особенно хорошо, потому что зритель уже знает исходную сцену и быстрее понимает идею.
Вместо объяснения длинным текстом можно использовать знакомый визуальный конфликт.
Какие типы адаптаций работают лучше всего
На практике чаще всего используются несколько конструкций.
Сцена выбора. Герой стоит перед двумя вариантами.
Контраст двух путей. Показано два разных будущих сценария.
Известная сцена с новой репликой. Меняется смысл диалога.
Мем с заменой текста. Меняется только подпись.
Плакатная сцена. Один сильный символ или объект.
Сцена выбора «красная или синяя таблетка»
Один из самых известных шаблонов — сцена выбора из фильма «Матрица».
Такую конструкцию можно использовать для визуализации решений.
Типичная структура сцены:
— герой в центре
— два варианта
— контрастный свет
— сильный символ
Текст может быть коротким или вообще отсутствовать.
Пример постановки задачи
Слабый запрос: сделай мем по Матрице
Рабочий запрос: создай драматичную сцену выбора в духе известного эпизода с красной и синей таблеткой: один вариант символизирует привычную жизнь и иллюзию, второй — правду и развитие
Так модель получает понятную структуру сцены.
Быстрый шаблон адаптации
Используй известную сцену выбора, но измени смысл: герой выбирает между вариантом А и вариантом Б
Проверяемый критерий
Если зритель узнаёт конструкцию сцены и сразу понимает новый смысл, адаптация работает правильно.
Если изображение выглядит как случайная сцена без узнаваемой структуры, адаптация не сработала.
Практика
Сделайте пять изображений, используя разные конструкции:
— сцена выбора
— конфликт двух путей
— пробуждение героя
— до‑после
— герой против системы
После генерации посмотрите, какие сцены быстрее всего считываются без объяснений.
Продолжение Гайда - Картинки в ChatGPT: практический продвинутый уровень 2 часть