Найти в Дзене

Как иллюстрировать истории с помощью нейросети "Кандинский"

Рассказываю о простом способе сгенерировать серию иллюстраций для рассказа в одном стиле

"Как хорошо уметь читать", "Кандинский" 2.1, экран, пиксели, 2023. Фрагмент.
"Как хорошо уметь читать", "Кандинский" 2.1, экран, пиксели, 2023. Фрагмент.

Обратите внимание: способ, о котором я рассказываю ниже, работает только с версией нейросети 2.1. Получить к ней доступ можно на сайте ruDALL-E, выбрав в меню сайта пункт "Предыдущие модели" и в нём - Kandinsky 2.1, а можно перейти прямо отсюда по этой ссылке.

Способность нейросетей за несколько секунд сгенерировать изображение, которое может выглядеть не хуже (а то и лучше) созданного человеком за несколько часов, уже вовсю используется продвинутыми гражданами в практических целях, а не просто для любования.

Подозреваю, что примерно каждый день появляются новые обложки для музыкальных альбомов, афиши любительских спектаклей или целые мобильные приложения, созданные при помощи искусственного интеллекта.

Допустим, вы молодой начинающий литератор. У вас богатое воображение, но на этом ваши богатства заканчиваются. Ваш бюджет не предусматривает трат на художника, а что за книжка без картинок, пусть даже опубликованная пока только на бесплатных ресурсах или в вашем личном блоге?

Если ещё пару лет назад ваша проблема была бы труднорешаема, то сегодня вы знаете, куда идти и к кому обращаться.

Вот живой пример: обложка к сборнику рассказов Елены Матеуш, взята из её блога:

Иллюстрация для обложки сгенерирована нейросетью "Кандинский" 2.1 по запросу автора рассказа.
Иллюстрация для обложки сгенерирована нейросетью "Кандинский" 2.1 по запросу автора рассказа.

Есть, правда, нюанс. Обложка - одно дело, но с иллюстрациями могут возникнуть сложности. Все перечисленные выше проекты возможны потому, что для них достаточно одиночных изображений. Они не требуют серий иллюстраций со сквозными персонажами, которые на каждой картинке должны выглядеть плюс-минус одинаково. Для такой работы, насколько мне известно, по-прежнему нужен естественный интеллект.

Нейросети - во всяком случае, пока - создают каждую картинку вне контекста, то есть без связи с предыдущими генерациями. У вас не получится придумать главного героя по имени, скажем, Феоктист Семёнович, и просить нейросеть изобразить вам Феоктиста Семёновича в десяти различных интерьерах и ситуациях в разные годы его жизни. Поэтому связно проиллюстрировать роман с помощью ИИ пока проблематично.

Для детской книжки, где история может быть короткой, но очень богато иллюстрированной - по картинке на каждой странице, - тем более лучше нанять профессионального художника (и заплатить ему гонорар. Покартиночно, да).

Но можно попытаться создать три-четыре иллюстрации с одним и тем же персонажем для коротенького рассказика, в котором действие происходит в течение небольшого промежутка времени. Это вполне реально. Для этого нужно творчески использовать особенность "Кандинского" версии 2.1, о которой говорилось в предыдущей публикации.

Если отправлять "Кандинскому" один и тот же запрос снова и снова, результаты генерации будут очень похожи. Выбрав стиль единожды, "Кандинский" от него не отступается: то, что надо для нашей цели. "Шедеврум" для этой задачи не подойдёт - слишком разносторонен.

Но нам не нужны картинки, на которых изображено одно и то же, вид сбоку, так? Нам нужно менять как минимум обстановку вокруг героя. Так что же делать?

Предлагаю вам попробовать один способ создания серий иллюстраций, который в моих тестовых испытаниях пока что показывает хорошие результаты.

Я не гарантирую, что ваш персонаж будет выглядеть абсолютно идентично на всех картинках, и уж тем более - что у него всегда будет здоровое количество пальцев (глаз, хвостов или других частей тела). Но, во всяком случае, сходство будет достаточным для того, чтобы убедить читателя, что это один и тот же герой. Минимальные навыки работы в "Фотошопе" или аналогичном графическом редакторе помогут справиться с небольшими дефектами, а основная работа будет в любом случае выполнена за вас. Если вы готовы мириться с этими маленькими неудобствами, читайте дальше.

Для начала составьте максимально подробный запрос. Важно описать не только главного героя, его одежду, аксессуары и характерные черты внешности, но и атмосферу рисунка: освещение, цветовую палитру, настроение, технику и стиль. Постарайтесь создать живое описание (вы же писатель, в конце концов!), чтобы результат генерации сразу по возможности соответствовал вашему видению картинки.

Запрос: милый улыбающийся лисёнок в синей куртке вприпрыжку бежит по дороге, вымощенной разноцветными конфетами, тёплое освещение, контражур, насыщенные цвета, тёмный фон с размытыми цветовыми пятнами, стиль 3D анимации, стиль: artstation.

"Кандинский" 2.1. Здесь всё было хорошо, но меня не устраивал уровень счастья персонажа, поэтому нейросеть получила второй уточнённый запрос - результат ниже.
"Кандинский" 2.1. Здесь всё было хорошо, но меня не устраивал уровень счастья персонажа, поэтому нейросеть получила второй уточнённый запрос - результат ниже.

Запрос: милый счастливый маленький лисёнок в синей курточке бежит по дороге из разноцветных конфет, высоко подпрыгивая, улыбается, дождь из конфет, тёплое освещение, контражур, закатное освещение, насыщенные цвета, цифровая живопись, эстетично, реалистично, высокая детализация, атмосферно, стиль: artstation.

"Кандинский" 2.1. Конфеты, к сожалению, исчезли, зато персонаж по-настоящему счастлив.
"Кандинский" 2.1. Конфеты, к сожалению, исчезли, зато персонаж по-настоящему счастлив.

Затем аккуратно начинайте менять в описании действия, которыми занят персонаж, или обстановку, в которой он находится. За один запрос по возможности делайте только одну-две замены. Будьте очень осторожны и не трогайте без надобности ничего, кроме самого необходимого, иначе "Кандинский" может расценить это как повод полностью пересмотреть выбранное направление работы и начать всё с нуля.

Освещение, цветовую палитру и общую атмосферу желательно оставлять без изменений. Это добавит визуального единства вашей серии и снизит вероятность взбрыка нейросети. Для надёжности рекомендую попробовать добавлять к запросу один и тот же модификатор, логичнее всего для иллюстраций - artstation. Хоть в телеграм-боте "Кандинского" он и работает через раз, но мне повезло: мне выпадали именно эти разы.

Запрос: милый счастливый маленький лисёнок в синей курточке бежит по дороге из разноцветных конфет, высоко подпрыгивая, держит блюдце с пирожными, улыбается, дождь из конфет, тёплое освещение, контражур, закатное освещение, насыщенные цвета, цифровая живопись, эстетично, реалистично, высокая детализация, атмосферно, стиль: artstation.

"Кандинский" 2.1. Нет конфет - есть пироженки. И два хвоста. Профит!
"Кандинский" 2.1. Нет конфет - есть пироженки. И два хвоста. Профит!

Запрос: милый счастливый маленький лисёнок в синей курточке держит блюдце с пирожными, улыбается, читает книгу, тёплое закатное освещение, контражур, насыщенные цвета, цифровая живопись, эстетично, реалистично, высокая детализация, атмосферно", стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

В последней генерации контражур из описания пропал, но "Кандинский" по инерции продолжал его соблюдать. Заметьте, что даже куртка на персонаже одна и та же!

Кстати о куртке. Похоже, нейросеть может считать её очень важной деталью... или не её. При попытке поменять цвет куртки и время суток одновременно на выходе получаем совсем другого персонажа, заметно старше. Он может быть близким родственником первому или даже им же, но повзрослевшим, но это явно больше не "милый маленький лисёнок".

Запрос: милый счастливый маленький лисёнок в синей зелёной курточке читает книгу, пьёт чай, тёплое закатное солнечное утреннее освещение, насыщенные цвета, цифровая живопись, эстетично, реалистично, высокая детализация, атмосферно, стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

Если повернуть время вспять, то есть вернуть синюю куртку и закат, получаем очень похожего на первоначального, но всё же немного другого персонажа (чья морда просит доработки, но вы были предупреждены).

Запрос: милый счастливый маленький лисёнок в синей курточке смотрит в небо на птиц, тёплое закатное освещение, насыщенные цвета, цифровая живопись, эстетично, реалистично, высокая детализация, атмосферно, стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

Для закрепления материала провернём тот же трюк с гуманоидным персонажем.

Запрос: мудрый знахарь, травник, с посохом, с амулетами, длинная борода, собирает травы на поляне в лесу, мягкое закатное освещение, цифровая живопись, эстетично, реалистично, атмосферно, стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

Запрос: мудрый знахарь, травник, с посохом, с амулетами, длинная борода, собирает травы на поляне в лесу, стоит около хижины в лесу, мягкое закатное освещение, цифровая живопись, эстетично, реалистично, атмосферно, стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

Запрос: мудрый знахарь, травник, с амулетами, длинная борода, стоит около хижины в лесу кипящего котла, интерьер хижины, мягкое закатное освещение от очага, цифровая живопись, эстетично, реалистично, атмосферно, стиль: artstation.

"Кандинский" 2.1
"Кандинский" 2.1

Запрос: мудрый знахарь, травник, с амулетами, длинная борода, стоит около кипящего котла в лесу, рядом стоит олень, мягкое освещение от очага, цифровая живопись, эстетично, реалистично, атмосферно, стиль: artstation.

"Кандинский" 2.1. Рога на голове травника стали для меня некоторой неожиданностью, но ему с его сакральным знанием видней, как оленей приманивать.
"Кандинский" 2.1. Рога на голове травника стали для меня некоторой неожиданностью, но ему с его сакральным знанием видней, как оленей приманивать.

С развитием нейросети качество иллюстраций, хочется верить, будет повышаться. Если свойство "Кандинского" сохранять в серии генераций выбранный стиль, оказавшееся таким полезным, не исчезнет в последующих версиях программы, он может стать отличным помощником для молодых писателей. Начинать практиковаться можно уже сейчас.

В общем, запускайте воображение и творите!