Найти тему

Неча на зеркало пенять, или Как писать классные промты для нейросетей чтобы они создавали вам яркие реалистичные картинки: личный опыт 👇

Оглавление

Сразу оговорюсь — нет 100%-ной гарантии, что искусственный разум сгенерирует именно такую картинку, которая вам нужна. Общение с нейросетями это всегда территория вероятностей. Поговорим сегодня о том, как повысить вероятность получить красивую картинку, созданную для вас искусственным интеллектом…

Работа с Кандинским 2.2 👇

Кандинский — искусственный разум довольно простой. Ему нет смысла давать длинные промты со множеством подсказок в стиле «фотография», «реалистичное изображение». Главное — подробно описывать результат, применяя минимум абстрактных терминов и максимум конкретики.

Я сгенерировала изображения комнаты с креслом и камином, сгенерированной по простому и по очень развернутому описанию, и посмотрите — разительных отличий между ними нет.

Вот простой промт:

-2

А вот результат:

-3

Вот развернутый промт:

-4

Результат мало отличается:

-5

Зато Кандинский знает художников и может делать стилизации. Вот посмотрите на результат — ко второму промту я добавила только одну фразу: «Картина в стиле Пабло Пикассо»:

-6

Еще эта нейросеть хорошо генерирует картинки по предельно простым и четким запросам, вот таким:

-7

Результат предсказуем:

-8

Для улучшения результата работы с Кандинским 2.2 можно сделать еще вот что:

+ Указать, что черты лица детально проработаны, и тогда сгенерированный человек с большой долей вероятности получится лицом к нам, а не спиной, как любит рисовать Кандинский.

+ Написать, что у людей на каждой руке (не «на руках») по 5 пальцев. Не факт, что Кандинский учтет эту просьбу, он любит пальцев дать побольше, но вероятность получить нормальные кисти рук возрастет.

-9

+ Использовать в момент выбора стиля опцию «без стиля» — так нейросеть будет ориентироваться только на ваше описание. Кандинский хорошо работает со стилем «анимэ», а остальными, пожалуй, лучше не пользоваться. По крайней мере, мой опыт говорит об этом.

+ Можно использовать опцию «Смешивание картинки и текста». То есть найти картинку, похожую на ту, что вы хотите получить, прикрепить ее и указать текстом, какие изменения вы хотите получить.

Кстати, Кандинский очень неплохо генерирует натюрморты:

-10

И пейзажи:

-11

А вот сходства с известными российскими личностями, например, с Владимиром Жириновским, добиться от нейросети крайне сложно, а часто и невозможно.

Ну разве это Жириновский?
Ну разве это Жириновский?

Работа с Midjorney и Stable Diffusion 👇

Я взаимодействую с этими нейросетями только через Телеграм, что несколько ограничивает возможности. Тем не менее, их все равно много. И вот что нужно знать для удачной генерации изображений…

Обе нейросети очень чувствительны к промтам. Например, здесь уже можно прописывать требования о фотореалистичности изображения, указывать, что необходимо детально прорисовывать лицо. Важно указывать и то, что люди должны быть европейской внешности (если вам нужно именно это), иначе результат генерации может выдать азиатов, негров, мулатов.

Важно давать и негативный промт, то есть то, чего не должно быть на картинке. Негативный промт может выглядеть так: «Нет уродств, нет двойных голов, нет отдельных фрагментов тел, нет слишком ярких цветов». И вероятность получить хорошую картинку в этом случае увеличится.

Обе нейросети англоязычные, можно, конечно, вводить промты на русском и искусственный интеллект сам переведет их. Но лучше воспользоваться хорошим переводчиком (Яндекс Переводчик и Гугл Переводчик не подойдут), и давать нейросети задание на английском — результат может быть лучше и реалистичнее.

Вот пример генерации по промту такого вида:

«A pleasant young man of European appearance with a well-drawn face holds a bouquet of flowers. Realistic image, photo, no ugliness, no double head»

-13

Обе нейросети сначала воспринимают слова, которые стоят ближе к началу. Если поменять порядок слов, результат изменится. Например, в предыдущем запросе я вынесла вперед букет, а слова про парня передвинула дальше от начала. Почувствуйте разницу в результате перестановки слов:

-14

Stable Diffusion понимает еще и знаки, например, скобки. Любое слово, заключенное в скобки, приобретает для нейросети больший вес и с бо́льшей вероятностью будет учтено при генерации. Скобки могут быть и ((двойными)), и даже (((тройными))).

А еще если вы хотите получить не портрет, а полное изображение человека, можно описать, во что он одет, и что находится рядом, и нейросеть будет генерировать более полную картинку.

Кстати, эти нейросети знают известных людей, например, актеров — но не наших российских, а только западных. И вполне могут генерировать картинки с ними.

Вот это, например, не фото, а результат генерации:

-15

Итого

Писать промты для нейросетей — это совершенно особый род деятельности который, скорее всего, вскоре станет и отдельной профессией.

Но и не особенно погружаясь в эту тему все-таки можно научиться генерировать вполне приличные картинки для иллюстрации, например, собственных статей.

А почему бы и нет, если появилась такая возможность?

Еще почитать интересное про нейросети👇

✅ Подписывайтесь на мой канал здесь, читайте и комментируйте — буду рада вас видеть в следующих публикациях!