Из этого урока вы узнаете, как составить текст для генерации изображения в нейросети. Принцип составления описания похож для всех генеративных нейросетей. Так как у нас идёт бесплатный курс по использованию нейросети Kandinsky, будем рассматривать на его примере.
На прошлом уроке этого бесплатного курса по нейросети Kandinsky мы рассмотрели три платформы для генерации на модели Kandinsky 2.1. Вы уже знаете куда идти, чтобы сгенерировать картинки. Сегодня научимся описывать то, что хотим получить от нейросети.
Что такое промт
Работая с любыми нейросетями вы постоянно будете пользоваться термином "Промт".
Промт - это прямая калька с английского слова Prompts. Переводится как подсказка, запрос, приглашение, командная строка. То есть, когда мы пишем промт, мы делаем нейросети запрос.
Промты нужны для того, чтобы направлять сеть на генерирование релевантных и согласованных выходных данных, соответствующих задаче и предметной области.
Промт может быть текстовым, графическим и комбинированным.
Текстовый промт - это словесное описание желаемого изображения.
Графический промт - любое изображение.
Комбинированный промт - изображение и текстовое описание.
Текстовый промт
Качественный промт должен содержать в себе информацию о том, ЧТО должно быть на картинке, и КАК это должно быть изображено.
Условно промт можно разделить на две логические части:
- Художественная - описание образа (что).
- Визуальная - цветовое и стилистическое решение (как).
Рассмотрим на примере котиков от нейросети Kandinsky.
Что генерировать
Промт: кот сидит на подоконнике.
Промт очень простой, поэтому у нас получился среднестатистический образ кота. Средней пушистости, средней полосатости, даже морда среднестатистическая. Кстати, можете сравнить с котиками из предыдущего урока. Там генерация делалась по такому же запросу. Убедитесь, насколько эти коты похожи друг на друга.
Теперь добавим конкретики в описание будущего изображения.
Промт: Белая пушистая кошка с жёлтыми глазами сидит на подоконнике.
И вот вам уже пушистая красавица. Видите, как сильно конкретизация влияет на результат.
Теперь добавим детали на изображение.
Промт: Белая пушистая кошка с жёлтыми глазами сидит на подоконнике. Красивые кружевные занавески.
Теперь у нас есть красивые шторы. Обратите внимание, я не указывала цвет занавесок, но указала "жёлтые глаза". Поэтому жёлтый цвет начал использоваться в композиции в целом.
Промт: Белая пушистая кошка с жёлтыми глазами сидит на подоконнике. Красивые кружевные занавески. Цветы фиалки в горшке.
С ботаникой во многих нейросетях возникают трудности, поэтому для растений лучше использовать их латинские названия. Но посмотрите на цветовую гамму - к жёлтому добавился фиолетовый.
Как генерировать
Добавим в описание художественный стиль.
Промт: Белая кошка сидит на подоконнике. Ваза с цветами. Стиль: Акварельный рисунок.
Промт: Персидская кошка кошка сидит на подоконнике. Красивые кружевные занавески. Стиль студии Pixar.
Кошка теперь выглядит мультяшно. Для разных студий характерен свой стиль. Сравните.
Промт: Персидская кошка. Стиль студии Pixar.
Промт: Персидская кошка. Стиль советского мультфильма.
Третья неделя курса будет полностью посвящена особенностям составления промтов для нейросети. Поэтому если вы ещё не подписаны на канал - подписывайтесь. Тогда точно не пропустите новые уроки.
Подведём итог
На этом уроке мы узнали, что промт - это подсказка с описанием будущего изображения. Промт может быть текстовый, то есть описанный словами. Промты бывают графическими - совершенно любое изображение. А так же можно использовать комбинацию фото и текста.
Мы познакомились с основной структурой тестового промта. Посмотрели на примерах, как влияет на результат подробное описание того, ЧТО нам надо изобразить. Применили три разных стиля и их влияние на то, КАК будет изображён объект.
Все уроки доступны на моём канале в подборке "Курс по Kandinsky".
Надеюсь эта статья была для вас полезна.
До встречи в новом уроке "Нейросеть Kandinsky: как правильно генерировать горизонтальные и вертикальные картинки на сайте ruDALL-E".
Ещё на канале:
В статье "Нейросеть рисует по словам: что это значит и какие слова использовать" я подробно описала элементы промта для нейросети Midjourney. В целом промты для генеративных нейросетей похожи, поэтому дополнительно прочитать эту статью будет полезно.