Vladimir Sukhov | Нейросети, профессии и доход

434 подписчика

Промпты для генерации изображений: как получить нужный результат с первой попытки

7 июня7 июн

259

7 мин

Большинство людей, впервые работающих с нейросетями, пишут промпты как поисковый запрос: "красивая девушка на закате". Получают что-то невнятное, расстраиваются и решают, что "это всё не работает". На деле проблема не в нейросети - проблема в том, что модель буквально не понимает, что вы хотите. И вот что интересно: самое частое заблуждение при написании промптов - это то, что больше слов даёт больше контроля. Спойлер: нет. К этому вернёмся в конце. Что вы узнаете: Промпт - это текстовая инструкция, которую вы передаёте нейросети. Но не просто описание. Это скорее техническое задание: модель не "видит" картинку в голове, она работает с токенами - единицами смысла в тексте. Для кого это важно: для всех, кто создаёт контент, занимается дизайном, маркетингом или просто хочет получить конкретный визуал под конкретную задачу. Промпт для нейросети - это навык, который обучается за несколько часов практики. Когда это не работает: если вы ожидаете телепатии. Нейросеть не знает ваш проект, ваш

Оглавление

Что вообще такое промпт для изображения
Структура промпта: семь слоёв, которые реально работают
Какие слова работают в промптах для изображений

Что вы узнаете:

Почему "красивый" и "детализированный" - бесполезные слова, и что писать вместо них
Как устроена базовая структура промпта для любой нейросети
В чём принципиальная разница между Midjourney, Stable Diffusion и Flux
Где чаще всего ломается даже хорошо составленный промпт
Один приём, который улучшает 80% результатов без переписывания промпта с нуля

Что вообще такое промпт для изображения

Промпт - это текстовая инструкция, которую вы передаёте нейросети. Но не просто описание. Это скорее техническое задание: модель не "видит" картинку в голове, она работает с токенами - единицами смысла в тексте.

Для кого это важно: для всех, кто создаёт контент, занимается дизайном, маркетингом или просто хочет получить конкретный визуал под конкретную задачу. Промпт для нейросети - это навык, который обучается за несколько часов практики.

Когда это не работает: если вы ожидаете телепатии. Нейросеть не знает ваш проект, вашу аудиторию и ваш вкус. Она работает с тем, что написано.

Структура промпта: семь слоёв, которые реально работают

Базовая формула выглядит так: субъект - действие или поза - окружение - освещение - стиль - технические параметры - негативный промпт.

Разберём на примере. Вместо "девушка на закате" получаем: "young woman sitting on wooden pier, looking at horizon, golden hour lighting, warm orange reflections on water, shot on Canon EOS R5, 85mm f/1.4, cinematic color grading".

Разница очевидна. Первый вариант - пожелание. Второй - техзадание.

Важный момент про порядок слов: нейросеть читает промпт слева направо, и первые токены имеют больший вес. Значит, самое важное - в начало. Если вам нужен портрет, слово "portrait" должно стоять первым, а не в середине абзаца.

Какие слова работают в промптах для изображений

Вот где большинство теряют время. Абстрактные прилагательные - "красивый", "детализированный", "удивительный" - имеют нулевой сигнал для модели. Это не значит, что слово обрабатывается неправильно. Это значит, что модель просто не знает, как интерпретировать "красивый" в пикселях.

Конкретные слова работают иначе. "Daguerreotype color grading" - это уже целая эстетика. "Shot on Hasselblad" мгновенно задаёт тип изображения. "Kodachrome color grading" даёт характерные тёплые тона плёнки 70-х.

Самый быстрый способ улучшить промпт: заменить одно абстрактное прилагательное на конкретный технический термин. Не "хорошее освещение", а "studio softbox lighting" или "rim light" или "volumetric lighting".

Кстати, освещение - это вообще самый мощный рычаг. Добавление правильного типа света улучшает результат в большинстве случаев, даже если остальной промпт средний (а такое бывает чаще, чем кажется).

Как написать промпт чтобы нейросеть понимала: разница между моделями

Здесь начинается то, что многие не учитывают - и потом удивляются, почему чужой промпт не работает у них.

У каждой модели своя "грамматика".

Midjourney любит флаги: --ar 16:9 для соотношения сторон, --s 750 для уровня стилизации, --no для запретов. Оптимальная длина промпта - около 60 токенов. Если хотите точное следование тексту, а не "интерпретацию" - добавьте --style raw. Хорош для художественных и стилизованных изображений.

Stable Diffusion работает на тегах через запятую. Синтаксис (keyword:1.3) позволяет усилить конкретное слово. Негативный промпт здесь - обязательный элемент, без него качество заметно ниже. Стандартный набор quality boosters: "masterpiece, best quality, highly detailed". CFG Scale оптимум - 7-12.

Flux - отдельная история. Модель вышла в середине 2024 года и к 2025-2026 стала лидером по реализму. Использует T5-XXL энкодер и понимает натуральный язык - то есть писать можно прозой, как человеку. Легко держит 120+ токенов. CFG Scale оптимум - 3.5-4.0 (это принципиально отличается от SD, ну, то есть не 7 там надо ставить, а значительно ниже). И важно: Flux не поддерживает синтаксис MJ и SD, (keyword:weight) и флаги --ar в тексте он трактует буквально или игнорирует. Хорошо рендерит текст в изображениях.

GPT Image 2 и модели на натуральном языке типа Nano Banana Pro: порядок описания - фон, потом субъект, потом детали, потом ограничения. Хорошо понимает прозу, отдельного негативного промпта нет - запреты пишутся в основном тексте.

Вывод простой: промпт, который работает в Midjourney, может дать странный результат в Flux. Грамматика разная. Это как скопировать формулу из Excel в Google Sheets - иногда работает, иногда нет.

Кстати, если тема интересна — в Telegram-канале пишу о подобном регулярно: инструменты, лайфхаки, конкретные сценарии использования нейросетей в жизни и бизнесе. Там проще задать вопрос и не ждать следующей статьи.

Промпты для портретов: что добавить для качества

На одном проекте мне нужна была серия портретных фото для карточек спикеров. Первые пять попыток давали что-то среднее - лица немного размытые, руки иногда странные, фон невнятный. Решение оказалось простым: добавить конкретную камеру и объектив.

"Shot on Sony A7R IV, 85mm f/1.4, shallow depth of field, subject in sharp focus" - и качество картинок сразу вышло на другой уровень. Это не магия: конкретные технические термины активируют в модели кластеры, связанные с профессиональной фотографией.

Для портретов особенно важны: тип освещения (rim light, butterfly lighting, Rembrandt lighting), указание на фокус (sharp focus on face, bokeh background), и конкретный объектив. Негативный промпт для портретов - обязательно: "blurry, extra fingers, deformed hands, watermark, low quality". Не более 10-15 слов - больше начинают мешать друг другу.

И ещё одна тонкость: частица "не" в основном промпте не работает, а иногда даже вредит. Нейросеть не умеет обрабатывать отрицание так, как человек. Запрещать нужно через --no в Midjourney или через негативный промпт в отдельном поле.

Частые ошибки

Ошибка 1: Слишком длинный промпт. После примерно 60 токенов в Midjourney начинается "токенный шум" - поздние элементы конкурируют между собой и смазывают результат. Длинный промпт - не более детальное ТЗ, а каша.

Ошибка 2: Абстрактные прилагательные в начале. "Amazing, beautiful, stunning portrait of..." - все три слова на нулевом сигнале, а они занимают позиции с максимальным весом. Выброс ценного места.

Ошибка 3: Использовать синтаксис одной модели в другой. "Masterpiece, best quality" в начале Flux-промпта - модель воспримет это буквально и попытается изобразить "шедевр" как объект.

Ошибка 4: Менять несколько переменных за раз. Если после одной итерации вы переписываете половину промпта, вы не знаете, что сработало. Лучшие результаты получаются за 3-5 итераций, где каждый раз меняется одна вещь.

Ошибка 5: Отсутствие освещения в промпте. Это самый быстрый способ получить плоскую, невыразительную картинку. Даже одно слово - "golden hour", "studio lighting", "overcast" - кардинально меняет атмосферу.

Когда стоит разобраться глубже

Описанного выше достаточно для 80% задач. Но если вы работаете с генерацией систематически - создаёте контент, брендинг, иллюстрации - есть смысл разобраться с LoRA-моделями в Stable Diffusion, с ControlNet для контроля поз и композиции, с инпейнтингом для точечного редактирования. Это уже другой уровень контроля, где промпт - только часть инструментария. Пара конкретных мест, где всё это разбираем практически, в самом конце статьи.

Если хочется не просто читать про AI, а реально его применять, у меня есть несколько мест, где это можно делать вместе.

Начать стоит с Telegram-канала. Это наш основной ресурс, где разбираем новые инструменты, кейсы автоматизации и приёмы, которые можно применить уже завтра.

Если зайдёт, залетайте в AI BASE. Это закрытое сообщество, где я делюсь личными наработками по автоматизации, вайб-кодингу и нейросетям.

А если хочется прямо сейчас сесть и попробовать руками, есть два бесплатных курса с нуля: по n8n для автоматизации без кода и по Claude Code для разработки в связке с AI.

FAQ

Где найти готовые промпты для генерации?

PromptHero, Civitai, OpenArt и сама галерея Midjourney - основные источники. Важно: не копировать слепо, а разбирать структуру. Чужой промпт даёт отправную точку, не готовый результат - у вас другая версия модели, другие настройки, другая задача.

Как сделать промпт на английском для лучших результатов?

Большинство моделей обучены преимущественно на англоязычных данных, поэтому английский промпт статистически даёт более предсказуемый результат. Flux и GPT Image 2 неплохо понимают русский, но для технических терминов (типы освещения, названия объективов, стилевые референсы) английский всё равно надёжнее.

Почему нейросеть не генерирует по моему промпту?

Три основные причины: слишком абстрактные слова, неправильный синтаксис для конкретной модели, или конфликт между элементами промпта. Попробуйте сократить промпт вдвое и оставить только самое важное - часто это сразу улучшает результат.

Как описать стиль в промпте для картинки?

Через конкретные референсы: "in the style of Edward Hopper", "Studio Ghibli aesthetic", "brutalist photography", "Kodachrome 64 film". Или через технические параметры: "shot on 35mm film, grain, high contrast". Абстрактные "в художественном стиле" - не работают.

Гаджеты и электроника

5,73 млн интересуются