Хочу показать вам, как я работаю над рисунками. Понятно, что никакая нейросеть не выдаст мгновенно именно то, что нужно. Особенно, если к рисунку есть вполне конкретные требования.
У меня они есть почти всегда, ведь мне обычно нужен не просто рисунок, а иллюстрация к рассказу.
Например вот этот рисунок - иллюстрация к рассказу «Принцесса Лидка», который я собираюсь скоро выложить. Мне нужна была девочка-подросток, светловолосая, большеглазая, хрупкая.
Собственно, именно с этого и начинается работа над рисунком - с описания. Нейросети надо дать запрос, и он должен быть достаточно подробным. Причем, если только это не российская нейросеть, запрос лучше создавать на английском языке. Даже если указано, что данная сеть понимает и русский. Проверено: результат будет отличаться.
Лично я на английском могу составить только самые простые предложения, так что пользуюсь переводчиком.
И так, первый запрос был: «Девочка-подросток со светлыми волосами и большими глазами, худая.»
И вот что я получила:
Ну... Это было не совсем то, что нужно. Определенно... Но, при этом, что-то от того, что я хотела получить, тут было.
Так что я решила работать с этими рисунками дальше. И для начала изменила запрос, добавив в описание: «в больничном халате». И прогнала оба рисунка через новый запрос. При работе с конкретным рисунком в той нейросети, которой я пользуюсь, можно выставить степень соответствия нового изображения исходному. Я ставила среднее соответсвие, так как мне нужно было получить девочку в другой одежде, но примерно с теми же чертами и в той же позе. Если бы мне надо было изменить, допустим, только количество пальцев на руках (а почти все нейросети иногда грешат тем, что рисуют лишние пальцы), я бы поставила высокую степень соответствия. А если бы мне нужна была другая поза или вообще другой образ - низкую.
Вот что получилось:
Как видите, в обоих рисунках можно узнать исходные варианты. И это, определенно, куда лучше первого варианта.
Для дальшейшей работы я выбрала, конечно же, второй рисунок. Без пятен на халате и с менее унылым лицом. По сути, на нем можно было бы и остановиться, но мне хотелось чего-то чуть более яркого. Да и с пальцами на рисунке была проблема...
Следующим изменением запроса стал цвет халата. Я указала, что он должен быть синим. И добавила окно в качестве фона.
Теперь запрос на русском языке выглядел так: «Девочка-подросток со светлыми волосами, в синем больничном халате, на фоне окна.»
Как видите, я убрала «худая» и «с большими глазами». Исходная картинка и так задавала и то, и другое. Но без уточнений следующие варианты должны были получиться менее болезненного вида.
Вот, что вышло:
Ну вот, с пальцами уже все нормально, цвета прибавилось. Но глаза все еще слишком большие, а личико слишком грустное. Добавляю в запрос: «с легкой улыбкой». И уменьшаю соответствие оригиналу.
Результат, определенно, радует:
И опять, можно было бы остановиться. Но мне захотелось сделать халат темнее. Не голубоватым, а именно синим. Так что меняю в описании цвет на «темно-синий».
Так... Халат - отлично! Но... Лицо стало куда более взрослым. Можно посмотреть еще варианты, или поработать с этим. Решаю поработать, и убираю в запросе слово «подросток». По идее, девочка на следующих вариантах должна теперь смотреться младше, чем на исходном.
Очень хороший вариант! Почти отличный. Но... Хочется еще немного младше. Добавляю уточнение возраста. Теперь запрос выглядит так: «Девочка одинадцати лет, со светлыми волосами и легкой улыбкой, в темно-синем больничном халате, на фоне окна.»
Итог был в начале статьи. Повторю его еще раз:
Практически то, что и хотелось. Может, девочка и выглядит чуть постарше, но не особо существенно. Дальше нет смысла мучать рисунок.
Хочу добавить, что на каждом этапе я показывала лучшее изображение, с которым и шли дальнейшие изменения. А таких изображений каждый раз было от 4х до 10ти.
То есть, получить результат, нужный именно вам, от нейросети можно. Но не сразу. Придется постараться. )
А вот изменения рисунка в динамике:
Выложила отдельным постом, так вставить в статью не вышло...
Хочу еще спросить: кому-нибудь интересно техническое описание работы с конкретной нейросетью, которой пользуюсь я? Чаще всего это Dream by WOMBO. В принципе она довольно понятна и так, потому не знаю, стоит ли делать статью.