Найти тему
КиберMamedov 💻🔥

ПРАВИЛЬНЫЙ ПРОМПТ для ГРАФИЧЕСКОЙ НЕЙРОСЕТИ

Совсем не те изображения генерирует нейросеть по вашим запросам? Думаете замена одной нейросети на другую исправит ситуацию? Нет. Проблема кроется именно в правильности запроса. Вам нужно научиться составлять запросы, для графической нейросети.

Запросы к нейросети, которые вы пишите, называются промптами. Далее будем использовать этот термин. Просто запомните, что промпт - это текстовый запрос к нейросети.

В этой статье вы узнаете о правилах составления промптов для графических нейросетей. Промпты для графических нейросетей значительно отличаются от текстовых.

В первую очередь необходимо разобраться в структуре промпта для графической нейросети.

Структура промпта

Чтобы получать желаемые изображения от нейросети вы должны придерживаться следующей структуры:

  1. Сюжет;
  2. Конкретика;
  3. Что детализировать;
  4. Фон;
  5. Стиль;
  6. Выделения;
  7. Цветовая палитра.

На первый взгляд выглядит немного непонятно, сейчас разберем каждый пункт.

Сюжет: это ровно то, что вы хотите увидеть на изображении. Большинство составляемых запросов заканчиваются на сюжете. Для примера можно привести такой сюжет:

Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы.

Конкретика: сюжет - это сцена, но чем эта сцена должна быть наполнена? Если этого не указать, то нейросеть добавит все по своему усмотрению. Вся конкретика перечисляется через запятые и должна уложиться в одно предложение. Рассмотрим пример:

Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере.

Что детализировать: это объект или персонаж, который вы хотите выделить на сцене вашего сюжета. В сюжете про класс, я хочу выделить самого Альберта Эйнштейна, поэтому данный пункт запишу так:

Детализация лица Альберта Эйнштейна.

Фон: речь идет не о фоновом цвете, а об окружающей среде. Необязательно писать конкретные предметы или пейзаж, можно обойтись абстрактным уточнением. Например:

Фон экспрессивный и эмоциональный.

Стиль: существует множество стилей рисунков и изображений, например:

  • скетчинг — быстрый рисунок;
  • дудлинг — произвольный рисунок с множеством деталей;
  • линейный — пейзажи, портреты, натюрморты и т.д.;
  • полигональный — рисунок состоит из полигонов;
  • реалистичность — рисунок с проработанными тенями;
  • фотореалистичный — говорит сам за себя;
  • мультяшный — показывает характер персонажа;
  • архитектурный — на рисунках обязательно будут элементы зданий, мебели и т.д.;
  • фантазийный — рисунки получаются детализированные или наоборот упрощенные;
  • карикатуры — например, шарж.

Здесь вы можете указывать какой хотите и даже придумывать свои стили. В моем примере стиль будет описан так:

Стиль: добродушно-юмористический шарж.

Выделения: в пункте детализация вы определяете персонажа или объект, который должен выделяться в сюжете. Кроме этого можно использовать еще один инструмент, который может обводить, осветлять или наоборот затемнять. Просто указываете как именно это сделать. Пример:

Выделяй контуры персонажей неоновым градиентным светом.

Цветовая палитра: если не указать цветовую палитру, т.е. список цветов, которые вы хотите использовать в изображении, то нейросеть сама выберет цвета. Цвета подбираемые нейросетью не всегда могут вас устроить. Поэтому важно прописать это самостоятельно. Вот мой пример:

Цветовая палитра: Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый.

Последовательность: обратите внимание, что все элементы структуры отделяются точкой (.):

Сюжет. Конкретика. Что детализировать. Фон. Стиль. Выделения. Цветовая палитра.

На каждый пункт структуры выделяется одно предложение, которое заканчивается точкой. Внутри предложения перечисления могут быть через запятую (,) или точку с запятой (;).

В результате у нас получился вот такой промпт:

Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы. Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере. Детализация лица Альберта Эйнштейна. Фон экспрессивный и эмоциональный. Стиль: добродушно-юмористический шарж. Выделяй контуры персонажей неоновым градиентным светом. Цветовая палитра: Стальной синий; Розово-эбонитовый; Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый

Теперь посмотрим, как придерживание структуры промпта влияет на конечный результат.

Результат работы структурного промпта

Для наглядности будем добавлять поэтапно каждое предложение промпта, который мы создали выше по структуре. Начнем с сюжета, напоминаю сюжет выглядит так:

Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы.

Я буду использовать нашу отечественную нейросеть Кандинский, а вы можете использовать любую. Смотрим на результат:

Результат генерации только по сюжету
Результат генерации только по сюжету

Видно, что согласно сюжету все сходится. Но мы ведь хотели не просто какую-то фотографию, а конкретный ресунок. Нейросеть ваши мысли уловить не может, поэтому их нужно доносить по структуре.

Сейчас наша структура промпта выглядит так:

Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Добавляем следующее предложение из структуры Конкретику:

Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы. Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере.
Результат с сюжетом и конкретикой
Результат с сюжетом и конкретикой

Видно, что начали учитываться детали промпта, но обратите внимание на нашего главного персонажа, он в этом сюжете не выделяется.

Именно такой размытый результат по персонажам дает промпт с заполненными двумя пунктами структуры:

Сюжет Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Теперь добавим пункт с детализацией персонажа:

Детализация лица Альберта Эйнштейна.
Результат изображения со структурой промпта: сюжет, конкретика, детализация
Результат изображения со структурой промпта: сюжет, конкретика, детализация

Мы видим, что лицо Эйнштейна стало более узнаваемым. В целом, сюжет стал больше замыкаться на его лице. Именно такой результат получается, если заполнены три пункта структуры:

Сюжет Конкретика Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Переходим к заполнению фона. Напоминаю наш промпт по фону выглядит так:

Фон экспрессивный и эмоциональный.

Результат:

Результат со структурой промпта: сюжет, конкретика, детализация, фон
Результат со структурой промпта: сюжет, конкретика, детализация, фон

Начали появляться какие-то эмоции, которые были заложены в запросе. Такой результат получается с четырьмя заполненными пунктами структуры:

Сюжет Конкретика Что детализировать Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Переходим к следующему шагу и добавляем стиль:

Стиль: добродушно-юмористический шарж.

Результат:

Результат со структурой промпта: сюжет, конкретика, детализация, фон, стиль
Результат со структурой промпта: сюжет, конкретика, детализация, фон, стиль

Стиль может внести значимые изменения в конечный результат изображения, но этого недостаточно для достижения цели. Эйнштейн, бедный, настолько эмоционален, что сходит с ума. Такой результат получается при пяти заполненных элементах структуры:

Сюжет Конкретика Что детализировать Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Следующи пункт структуры связан с выделением не просто так. Вы видите, что в предыдущем результате основной персонаж взял на себя всё внимание, а дети ушли в тень. Данный пункт поможет подстветить остальных персонажей:

Выделяй контуры персонажей неоновым градиентным светом.

Результат:

Результат со структурой промпта: сюжет, конкретика, детализация, фон, стиль, выделения
Результат со структурой промпта: сюжет, конкретика, детализация, фон, стиль, выделения

Вот и дети вышли из тени, только все какие-то зеленые. Это происходит из-за того, что в конкретике мы казали зеленую доску. Так получает, когда промпт содержит шесть пунктов структуры:

Сюжет Конкретика Что детализировать Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Остался заключительный пункт структуры Цветовая палитра, давайте его добавим.

Цветовая палитра: Стальной синий; Розово-эбонитовый; Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый

Результат.

 Результат полность заполненной структуры промпта
Результат полность заполненной структуры промпта

Промпт заполнен:

Сюжет Конкретика Что детализировать Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.

Вы заметили, что отсутствует важный элемент в сюжете “доска”? А нам этот элемент важно показать. Чтобы нейросеть обязательно отразила какой-то элемент из промпта, его необходимо взять [в квадратные скобки]. Немного подкорректируем промпт:

Альберт Эйнштейн стоит возле [зеленой доски], позади Альберта стоит 4 ученика, ученики стоят лицом к камере.

Результат:

Теперь так, как нужно.

Выводы

Вы увидели результат трансформации сюжета изображения в процессе заполнения структуры промпта.

Главное помните, что нейросеть не умеет читать ваши мысли, их необходимо доносить до неё на понятном ей языке. В первую очередь нужно придерживаться структуры.

Подписывайся, чтобы разбираться в IT просто.

Кстати, когда будете составлять свои промпты то максимально сосредоточьтесь, а для этого вам поможет эта фоновая музыка: