Давеча меня тут спросили, как загенерить изображение в популярной нейросети. Да и не раз спросили.
Сейчас я там иллюстрирую свои книги. Кратко расскажу, как создать такую картинку (это один из моих персонажей).
Чат-ботом пользоваться неприлично просто. На официальном сайте будет ссылка на сервер в Дискорде. Логинимся и в одной из комнат под названием newbie пишем запрос, который состоит из команды /imagine и далее вашего текста.
Вся соль как раз в том, чтобы грамотно составить запрос. Есть небольшой лайфхак.
1. Заходим на сайт Lexica Art.
2. Находим картинку, которая максимально близко отражает нужный стиль.
3. Копируем prompt. Это и есть тот самый запрос, который принимает нейросеть.
4. Вставляем в Midjourney после команды /imagine.
Имеет ли значение порядок описания?
Имеет. Нейросеть считывает синтаксис по порядку, подыскивая наиболее релевантные референсы для выдачи результата. Поэтому сначала задаем объект, затем его свойства, затем прочие условия и детали.
Какие есть недостатки?
Самый большой - это руки. Боль до скрипа зубов. Если нужно изобразить человека в полный рост, на руках может быть и по 6, и по 8 пальцев. Просто нейросеть еще не научилась различать такую довольно сложную часть тела.
Вторая боль - это динамические сцены с несколькими персонажами. Нужно четко описать, что в сцене именно два человека! Но будьте готовы к тому, что она может намиксовать их свойства. Например, описываем, что у нас в сцене две девушки, одна в синем платье с рыжими волосами, вторая в строгом черном костюме с русыми волосами. Так вот легко обе могут стать рыжими. Костюм может стать синим, а платье черным. Просто обновляйте запрос, корректируйте описание, пробуйте снова и снова. Иначе никак.
Если они стоят порознь, еще можно получить адекватный результат. Недавно для иллюстрации сцены из книги мне нужно было изобразить поцелуй. И, как вы понимаете, двух вполне конкретных персонажей! С конкретной внешностью и чертами. Вот уж была пляска на углях. Пришлось перебрать десятки вариантов, пока не получилось нечто похожее. В поцелуе для нейросети сложность была в том, чтобы провести границы двух лиц, которые довольно близко расположены. Там был и один нос на двоих, и чего только я не насмотрелась.
Вот, что у меня в итоге получилось:
Как изобразить одного персонажа в разных сценах?
Для иллюстрации книги вполне резонный вопрос, ведь результат генерации это чистый рандом, а нужно повторить одного и того же персонажа.
Для этого нужно использовать Puppet Method. Он работает по немного иному принципу, в FAQ Midjourney есть подробный гайд для этого метода. В детали вдаваться не буду, скажу только, что метод рабочий. Хоть и с кучей условностей, но работает.
Мой пример. Один и тот же персонаж в разных запросах. Кстати, на картинке выше с поцелуем это она же.
Или другой персонаж. Также два абсолютно разных запроса с использованием Puppet Method.
Небольшие отличия в лице можно откопать, но в целом она неплохо повторяет свой же результат.
Напоследок
Главный залог успеха в работе с нейросетью - экспериментировать. С каждым новым запросом нейросеть обучается и выдает все более крутые результаты.
Если захотите у меня что-то спросить касательно Midjourney - пишите в комментах, отвечу. Делитесь, кто пробовал? Для чего использовали нейросеть? Как успехи?