Найти тему
Пикабу

Как формулировать запросы для нейросети

Часть 1.

Составляем простой запрос

Для генерации картинки на самом деле достаточно и одного-двух слов. И такие генерации тоже получаются качественными и красивыми. Но при этом нейросеть сама «додумает» все детали, сюжет и композицию.

Поэтому, если такой «случайный» результат вас не устраивает, необходимо запрос дополнять и дорабатывать, желательно, используя определенные базовые знания.

Кот-художник / cat painter.

Составляйте запросы на английском языке

Нейросети обучались на парах картинка-описание на английском языке, поэтому его они лучше всего и понимают. Нейросети могут воспринимать другие языки и даже понимать эмодзи, но результаты будут непредсказуемы. Я плохо владею английским, поэтому для перевода я использую он-лайн переводчик. Замечено, что нейросетевой переводчик DeepL понимает контекст лучше, чем Google Translate или Яндекс-переводчик.

Объект

Объект – основа практически любого запроса, именно он будет в центре всего рисунка. Очевидно, что в первую очередь надо придумать именно его. Например, кот, волшебник, священник, ангел, император, некромант, рок-звезда, город, королева, дом, храм, ферма, машина, пейзаж, гора, река.

Нейросети обучают на огромной базе изображений из сети. Картинок такого типа в интернете много, поэтому нейросети легко их сгенерируют. Правда, если вписывать в команду исключительно один объект, то результаты вряд ли порадуют разнообразием. Поэтому попробуйте, например, совместить два объекта и получить необычный концепт: кот-геймер, кот-бэтмен, кот-киберпанк-монах.

.
.

Кот-геймер / cat gamer.

-3

Кот-бэтмен / batman the cat --c 75 --s 750 --q 2.

-4

Кот-киберпанк-монах / cat cyberpunk monk --c 75 --s 750 --q 2.

Объекты также можно совмещать через предлоги. «Кот, сделанный из фарфора», «Кот, как король Артур» или «Кот, похожий на Шрека».

-5

Кот, сделанный из фарфора - A cat made of porcelain.

-6

Кот, как король Артур - A cat like King Arthur.

-7

Кот, похожий на Шрека - A cat that looks like Shrek.

Да, кстати, известных персонажей тоже можно смело использовать в качестве объектов. Внешность Гарри Поттера или Леголаса не будет повторять сыгравших их актеров, но героев вы сразу узнаете.

-8

Гарри Поттер в костюме супермена / Harry Potter with a scar on his forehead in a superman suit

-9

Брюс Уиллис – киберпанк-монах / Bruce Willis cyberpunk monk

Количество

Если хотите, чтобы на изображении было несколько объектов, то указывайте их количество. Вместо «коты за столом» напишите «три кота за столом». Если использовать множественное число без указания значения, то нейросеть сгенерирует случайное количество котиков.

Числительные можно указывать как словами, так и цифрами.

С большим числом конкретных объектов, скажем, больше пяти-шести, нейросети справляются с трудом. Вероятность ошибки растет с каждым новым объектом в кадре. В таких случаях лучше уже сразу просить сгенерировать «толпу волшебников», но помните: чем больше объектов, особенно людей или животных, тем менее они детализированные.

-10

Один кот / 1 cat.

-11

Два кота / 2 cats.

-12

Три кота / 3 cats.

-13

Четыре кота / 4 cats.

-14

Пять котов / 5 cats - появляются ошибки в количестве.

-15

Шесть котов / 6 cats - появляются ошибки, как и в предыдущем случае.

Абстракции

Помимо реальных объектов нейросети могут генерировать абстрактные понятия вроде времени, судьбы, счастья или смысла жизни. Делают они это так же, как такие концепты обычно изображают в поп-культуре или искусстве. Сгенерируйте «когнитивный резонанс» или «создание времени» — результаты каждый раз будут удивлять.

Вот здесь есть пример подобного запроса: Midjourney рисует абстрактные понятия.

В то же время не стоит увлекаться и пытаться генерировать концепции, которые предполагают обдумывание и самостоятельные выводы. Если есть возможность — выбирайте конкретные запросы, где абстрактные понятия заменяются объектами. Вместо «оптимистичного будущего» попробуйте «солнечный футуристичный город» или «киберпанк-город с голограммами», а вместо «моды в 2222 году» — «футуристичную одежду со светящимися и красочными деталями».

-16

Солнечный футуристичный город / Sunny Futuristic city.

-17

Киберпанк-город с голограммами / Cyberpunk City with Holograms.

-18

Футуристичная одежда со светящимися и красочными деталями / futuristic clothing with glowing and colorful details.

От чего сразу стоит отказаться:

Отрицания. Избегайте слов «не», «без», «исключая», «кроме» и подобных. Нейросети воспринимают всё буквально и не замечают отрицательных частиц. По запросу «мужчина без бороды» нейросеть наверняка сгенерирует бородатого мужчину, поэтому напишите «чисто выбритый мужчина», чтобы точно получить то, что вам нужно.

Большое количество разных объектов. Велика вероятность, что нейросеть запутается, особенно если добавлять детали к каждому объекту.

Желание в точности передать реальный объект. Если вы напишете «Москва», то это не будет реальная столица России — лишь вариация нейросети с похожими элементами. То же самое и с попытками указать конкретных людей: Генри Кавилл, Илон Маск, Марк Цукерберг.

Спасибо за просмотр!

Продолжение следует.

Больше моих работ и примеров промптов: https://t.me/LuckySweet001

Пост автора LuckySweet001.

Комментарии