Найти в Дзене
МиМ

Иллюстрация к рассказу

Хочу показать вам, как я работаю над рисунками. Понятно, что никакая нейросеть не выдаст мгновенно именно то, что нужно. Особенно, если к рисунку есть вполне конкретные требования.

У меня они есть почти всегда, ведь мне обычно нужен не просто рисунок, а иллюстрация к рассказу.

Например вот этот рисунок - иллюстрация к рассказу «Принцесса Лидка», который я собираюсь скоро выложить. Мне нужна была девочка-подросток, светловолосая, большеглазая, хрупкая.

Собственно, именно с этого и начинается работа над рисунком - с описания. Нейросети надо дать запрос, и он должен быть достаточно подробным. Причем, если только это не российская нейросеть, запрос лучше создавать на английском языке. Даже если указано, что данная сеть понимает и русский. Проверено: результат будет отличаться.

Лично я на английском могу составить только самые простые предложения, так что пользуюсь переводчиком.

И так, первый запрос был: «Девочка-подросток со светлыми волосами и большими глазами, худая.»

И вот что я получила:

-2

-3

Ну... Это было не совсем то, что нужно. Определенно... Но, при этом, что-то от того, что я хотела получить, тут было.

Так что я решила работать с этими рисунками дальше. И для начала изменила запрос, добавив в описание: «в больничном халате». И прогнала оба рисунка через новый запрос. При работе с конкретным рисунком в той нейросети, которой я пользуюсь, можно выставить степень соответствия нового изображения исходному. Я ставила среднее соответсвие, так как мне нужно было получить девочку в другой одежде, но примерно с теми же чертами и в той же позе. Если бы мне надо было изменить, допустим, только количество пальцев на руках (а почти все нейросети иногда грешат тем, что рисуют лишние пальцы), я бы поставила высокую степень соответствия. А если бы мне нужна была другая поза или вообще другой образ - низкую.

Вот что получилось:

-4
-5

Как видите, в обоих рисунках можно узнать исходные варианты. И это, определенно, куда лучше первого варианта.

Для дальшейшей работы я выбрала, конечно же, второй рисунок. Без пятен на халате и с менее унылым лицом. По сути, на нем можно было бы и остановиться, но мне хотелось чего-то чуть более яркого. Да и с пальцами на рисунке была проблема...

Следующим изменением запроса стал цвет халата. Я указала, что он должен быть синим. И добавила окно в качестве фона.

Теперь запрос на русском языке выглядел так: «Девочка-подросток со светлыми волосами, в синем больничном халате, на фоне окна.»

Как видите, я убрала «худая» и «с большими глазами». Исходная картинка и так задавала и то, и другое. Но без уточнений следующие варианты должны были получиться менее болезненного вида.

Вот, что вышло:

-6

Ну вот, с пальцами уже все нормально, цвета прибавилось. Но глаза все еще слишком большие, а личико слишком грустное. Добавляю в запрос: «с легкой улыбкой». И уменьшаю соответствие оригиналу.

Результат, определенно, радует:

-7

И опять, можно было бы остановиться. Но мне захотелось сделать халат темнее. Не голубоватым, а именно синим. Так что меняю в описании цвет на «темно-синий».

-8

Так... Халат - отлично! Но... Лицо стало куда более взрослым. Можно посмотреть еще варианты, или поработать с этим. Решаю поработать, и убираю в запросе слово «подросток». По идее, девочка на следующих вариантах должна теперь смотреться младше, чем на исходном.

-9

Очень хороший вариант! Почти отличный. Но... Хочется еще немного младше. Добавляю уточнение возраста. Теперь запрос выглядит так: «Девочка одинадцати лет, со светлыми волосами и легкой улыбкой, в темно-синем больничном халате, на фоне окна.»

Итог был в начале статьи. Повторю его еще раз:

-10

Практически то, что и хотелось. Может, девочка и выглядит чуть постарше, но не особо существенно. Дальше нет смысла мучать рисунок.

Хочу добавить, что на каждом этапе я показывала лучшее изображение, с которым и шли дальнейшие изменения. А таких изображений каждый раз было от 4х до 10ти.

То есть, получить результат, нужный именно вам, от нейросети можно. Но не сразу. Придется постараться. )

А вот изменения рисунка в динамике:

Выложила отдельным постом, так вставить в статью не вышло...

Хочу еще спросить: кому-нибудь интересно техническое описание работы с конкретной нейросетью, которой пользуюсь я? Чаще всего это Dream by WOMBO. В принципе она довольно понятна и так, потому не знаю, стоит ли делать статью.