Совсем не те изображения генерирует нейросеть по вашим запросам? Думаете замена одной нейросети на другую исправит ситуацию? Нет. Проблема кроется именно в правильности запроса. Вам нужно научиться составлять запросы, для графической нейросети.
Запросы к нейросети, которые вы пишите, называются промптами. Далее будем использовать этот термин. Просто запомните, что промпт - это текстовый запрос к нейросети.
В этой статье вы узнаете о правилах составления промптов для графических нейросетей. Промпты для графических нейросетей значительно отличаются от текстовых.
В первую очередь необходимо разобраться в структуре промпта для графической нейросети.
Структура промпта
Чтобы получать желаемые изображения от нейросети вы должны придерживаться следующей структуры:
- Сюжет;
- Конкретика;
- Что детализировать;
- Фон;
- Стиль;
- Выделения;
- Цветовая палитра.
На первый взгляд выглядит немного непонятно, сейчас разберем каждый пункт.
Сюжет: это ровно то, что вы хотите увидеть на изображении. Большинство составляемых запросов заканчиваются на сюжете. Для примера можно привести такой сюжет:
Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы.
Конкретика: сюжет - это сцена, но чем эта сцена должна быть наполнена? Если этого не указать, то нейросеть добавит все по своему усмотрению. Вся конкретика перечисляется через запятые и должна уложиться в одно предложение. Рассмотрим пример:
Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере.
Что детализировать: это объект или персонаж, который вы хотите выделить на сцене вашего сюжета. В сюжете про класс, я хочу выделить самого Альберта Эйнштейна, поэтому данный пункт запишу так:
Детализация лица Альберта Эйнштейна.
Фон: речь идет не о фоновом цвете, а об окружающей среде. Необязательно писать конкретные предметы или пейзаж, можно обойтись абстрактным уточнением. Например:
Фон экспрессивный и эмоциональный.
Стиль: существует множество стилей рисунков и изображений, например:
- скетчинг — быстрый рисунок;
- дудлинг — произвольный рисунок с множеством деталей;
- линейный — пейзажи, портреты, натюрморты и т.д.;
- полигональный — рисунок состоит из полигонов;
- реалистичность — рисунок с проработанными тенями;
- фотореалистичный — говорит сам за себя;
- мультяшный — показывает характер персонажа;
- архитектурный — на рисунках обязательно будут элементы зданий, мебели и т.д.;
- фантазийный — рисунки получаются детализированные или наоборот упрощенные;
- карикатуры — например, шарж.
Здесь вы можете указывать какой хотите и даже придумывать свои стили. В моем примере стиль будет описан так:
Стиль: добродушно-юмористический шарж.
Выделения: в пункте детализация вы определяете персонажа или объект, который должен выделяться в сюжете. Кроме этого можно использовать еще один инструмент, который может обводить, осветлять или наоборот затемнять. Просто указываете как именно это сделать. Пример:
Выделяй контуры персонажей неоновым градиентным светом.
Цветовая палитра: если не указать цветовую палитру, т.е. список цветов, которые вы хотите использовать в изображении, то нейросеть сама выберет цвета. Цвета подбираемые нейросетью не всегда могут вас устроить. Поэтому важно прописать это самостоятельно. Вот мой пример:
Цветовая палитра: Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый.
Последовательность: обратите внимание, что все элементы структуры отделяются точкой (.):
Сюжет. Конкретика. Что детализировать. Фон. Стиль. Выделения. Цветовая палитра.
На каждый пункт структуры выделяется одно предложение, которое заканчивается точкой. Внутри предложения перечисления могут быть через запятую (,) или точку с запятой (;).
В результате у нас получился вот такой промпт:
Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы. Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере. Детализация лица Альберта Эйнштейна. Фон экспрессивный и эмоциональный. Стиль: добродушно-юмористический шарж. Выделяй контуры персонажей неоновым градиентным светом. Цветовая палитра: Стальной синий; Розово-эбонитовый; Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый
Теперь посмотрим, как придерживание структуры промпта влияет на конечный результат.
Результат работы структурного промпта
Для наглядности будем добавлять поэтапно каждое предложение промпта, который мы создали выше по структуре. Начнем с сюжета, напоминаю сюжет выглядит так:
Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы.
Я буду использовать нашу отечественную нейросеть Кандинский, а вы можете использовать любую. Смотрим на результат:
Видно, что согласно сюжету все сходится. Но мы ведь хотели не просто какую-то фотографию, а конкретный ресунок. Нейросеть ваши мысли уловить не может, поэтому их нужно доносить по структуре.
Сейчас наша структура промпта выглядит так:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Добавляем следующее предложение из структуры Конкретику:
Учитель (Альберт Эйнштейн) заходит в класс к ученикам начальной школы. Альберт Эйнштейн стоит возле зеленой доски, позади Альберта стоит 4 ученика, ученики стоят лицом к камере.
Видно, что начали учитываться детали промпта, но обратите внимание на нашего главного персонажа, он в этом сюжете не выделяется.
Именно такой размытый результат по персонажам дает промпт с заполненными двумя пунктами структуры:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Теперь добавим пункт с детализацией персонажа:
Детализация лица Альберта Эйнштейна.
Мы видим, что лицо Эйнштейна стало более узнаваемым. В целом, сюжет стал больше замыкаться на его лице. Именно такой результат получается, если заполнены три пункта структуры:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Переходим к заполнению фона. Напоминаю наш промпт по фону выглядит так:
Фон экспрессивный и эмоциональный.
Результат:
Начали появляться какие-то эмоции, которые были заложены в запросе. Такой результат получается с четырьмя заполненными пунктами структуры:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Переходим к следующему шагу и добавляем стиль:
Стиль: добродушно-юмористический шарж.
Результат:
Стиль может внести значимые изменения в конечный результат изображения, но этого недостаточно для достижения цели. Эйнштейн, бедный, настолько эмоционален, что сходит с ума. Такой результат получается при пяти заполненных элементах структуры:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Следующи пункт структуры связан с выделением не просто так. Вы видите, что в предыдущем результате основной персонаж взял на себя всё внимание, а дети ушли в тень. Данный пункт поможет подстветить остальных персонажей:
Выделяй контуры персонажей неоновым градиентным светом.
Результат:
Вот и дети вышли из тени, только все какие-то зеленые. Это происходит из-за того, что в конкретике мы казали зеленую доску. Так получает, когда промпт содержит шесть пунктов структуры:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Остался заключительный пункт структуры Цветовая палитра, давайте его добавим.
Цветовая палитра: Стальной синий; Розово-эбонитовый; Зелено-синий; Бистр; Серый коричневый; Золотой Крайола; Очень светлый зеленовато-синий; Мятно-бирюзовый
Результат.
Промпт заполнен:
Сюжет ⟶ Конкретика ⟶ Что детализировать ⟶ Фон ⟶ Стиль ⟶Выделения ⟶ Цветовая палитра.
Вы заметили, что отсутствует важный элемент в сюжете “доска”? А нам этот элемент важно показать. Чтобы нейросеть обязательно отразила какой-то элемент из промпта, его необходимо взять [в квадратные скобки]. Немного подкорректируем промпт:
Альберт Эйнштейн стоит возле [зеленой доски], позади Альберта стоит 4 ученика, ученики стоят лицом к камере.
Результат:
Теперь так, как нужно.
Выводы
Вы увидели результат трансформации сюжета изображения в процессе заполнения структуры промпта.
Главное помните, что нейросеть не умеет читать ваши мысли, их необходимо доносить до неё на понятном ей языке. В первую очередь нужно придерживаться структуры.
Подписывайся, чтобы разбираться в IT просто.
Кстати, когда будете составлять свои промпты то максимально сосредоточьтесь, а для этого вам поможет эта фоновая музыка: