Найти тему
Читающий Дарума

Литература и ИИ: 10 детских книг, проиллюстрированных нейросетью (ч.1)

Оглавление
(все иллюстрации в статье созданы нейросетью Кандинский 2.1)
(все иллюстрации в статье созданы нейросетью Кандинский 2.1)

В последнее время стали очень популярными различные нейросети, которые могут самостоятельно выполнять самые разные творческие задачи. Насколько самостоятельно? Считается, что они обладают собственным, хотя и искусственным, интеллектом.

Сейчас на многих ресурсах выкладываются результаты работы нейросетей, например: как ИИ видит города России в человеческом образе. Наверное будет интересно посмотреть, как нейросеть проиллюстрирует широко известные и любимые в нашей стране детские книги. Произведения выбирались рандомно и порядок их расположения в списке - произвольный. Десять из сотен и тысяч любимых с детства книг с иллюстрациями от искусственного художника.

Поехали!

Алиса в Стране чудес

Шедевр на все времена, написаный в 1865 году прозаиком и математиком Чарльзом Лютвиджем Доджсоном, известным всему миру любителей Алисы под псевдонимом Льюис Кэрролл. У нас нет возможности показать всех персонажей из историй про Алису, но на некоторых мы посмотрим через призму ИИ.

Алиса и Шляпник
Алиса и Шляпник

Шляпник, пожалуй, выглядит неплохо, вполне узнаваем, благодаря главному атрибуту. Подспудно казалось, что он будет напоминать Джонни Деппа из достойной экранизации, но нейросеть решила, что Ник Кейв в образе Шляпника смотрится лучше.

А вот Алиса удалась не очень. Все же, сказка про маленькую девочку, а не про ветерана боёв с постылой жизнью, бытовухой и алкоголем.

Алиса и Чеширский кот
Алиса и Чеширский кот

Чеширский кот выглядит немного пугающе, но Алиса спокойна, значит, кот только делает вид, что он страшный. А не Маша ли Распутина послужила моделью для этой иллюстрации?

Алиса и Красная королева
Алиса и Красная королева

Обе особы напряжены, атмосфера наэлектризована. Вопрос только в том, кто из них Алиса, а кто Красная королева. Видимо, для нейросети это тоже загадка и она, не мудрствуя лукаво, нарядила обеих в красное и выдала каждой по короне. Так что, кто есть кто - думайте сами, решайте сами.

Алиса. Просто Алиса.
Алиса. Просто Алиса.

А эта иллюстрация, сделанная в стиле «рисунок карандашом», на мой субъективный взгляд, удалась лучше всего - мы видим милую маленькую девочку, примерно того возраста, какого и должна быть настоящая сказочная Алиса. И очень надеюсь, что у неё на голове большие красивые банты, стилизованные под крылья бабочки, а не уши.

Выводы: нейросеть знает сказки про Алису достаточно неплохо, но не воспринимает их как детские произведения и рисует иллюстрации исходя из собственной оценки содержания. Сеть узнаёт не всех персонажей и иногда не может понять, чего от неё хотят. В целом, если не рассматривать картинки под микроскопом, то создаётся неплохое впечатление о её работе.

Приключения Тома Сойера

Одна из самых известных детских книг во всём мире, написанная знаменитым американским писателем Сэмюэлем Клеменсом, более известном как Марк Твен. В нашей стране всегда была очень популярной и, полагаю, остаётся такой и сегодня. Приключения предприимчивого мальчишки, в котором угадывается сам автор, в маленьком американском городке на великой реке Миссисипи. Вот как видит эту замечательную повесть нейросеть:

Том Сойер и Гек Финн
Том Сойер и Гек Финн

Нейросеть почему-то посчитала, что Том и Гек, если не двойняшки, то уж точно братья. Возможно, она пока не научилась понимать, что кроме имён у людей есть ещё и фамилии и ей кажется, что Том Сойер - имя. Зато одеты они почти в соответствии с эпохой, ну, если не придираться к тому факту, что Гек должен выглядеть как оборванец.

Никогда такого не было и вот опять (с)
Никогда такого не было и вот опять (с)

Попробовал немного изменить запрос, добавив данных, конкретизировав их, а ещё поменял стиль. И вот вам результат - те же братья-близнецы. Ну и придерусь к форме одежды - джинсовые комбинезоны все же рабочая одежда фермеров, а Том и Гек парни городские, жили в целом Санкт-Петербурге (их, вроде, в США несколько). Хотя, рисунок для машины с интеллектом очень даже неплох. Ловлю себя на мысли, что пока "рисунок карандашом" нравится мне больше всего.

Томас Сойер и Ребекка Тэтчер.
Томас Сойер и Ребекка Тэтчер.

Говорить о Томе Сойере и не вспомнить о Бекки Тетчер - нонсенс. Удивительно, но нейросеть выдала этот вариант с первого раза. Конечно, на этой иллюстрации Бекки одета, скажем так, слегка свободно. Мы-то знаем, что она дочь судьи, одного из первых людей города и такого легкомыслия позволить себе не может. Но ИИ такие тонкости, видимо, пока не доступны (ключевое слово - пока).

Нет, это не уроженец каких-нибудь Карибских островов.
Нет, это не уроженец каких-нибудь Карибских островов.

Это - индеец Джо! По крайней мере, нейросеть считает, что он должен выглядеть именно так. По мне, так он больше похож на Пятницу Робинзона Крузо. Ну и по выражению лица не скажешь, что этот парень отъявленный бандит. Ладно, попробуем скорректировать запрос, может, будет другой результат, поближе к первоисточнику.

Опять Пятница!
Опять Пятница!

Изменения есть, но не принципиальные - теперь, конечно, черты лица более суровые, но индейского ничего не появилось. Как были Карибы, так и остались. Сеть исходит из какой-то своей логики, для нас, людей, увы непостижимой.

А напоследок давайте посмотрим, как ИИ изобразит ещё одного героя - Гекльберри Финна, но без Тома Сойера, а с негром Джимом. Скажу сразу, по запросу про Гека и Джима выдавались результаты, странные до изумления, но с пятого или шестого раза получилось хоть что-то приличное.

Гек и Джим - лучшие из худших.
Гек и Джим - лучшие из худших.

На мой взгляд, здесь недостаток один - Джим выглядит как ровесник Гека, хотя, мы знаем, что в книге Джим - мужчина среднего возраста, а Гек Финн мальчик примерно 12-13 лет. Выражение лиц у них, будто бы они провожают свой любимый цирк. Но, по крайней мере, на этой иллюстрации изображены люди, в отличие от тех, что мне предлагались вначале.

Выводы: нейросеть знает об этой книге очень мало, но достаточно, чтобы описать её героев хотя бы отдалённо. В глаза бросается однотипная одежда и перебор с количеством близнецов. Представленные выше результаты, при небольшой корректировке могут даже украсить её новое издание.

Книга джунглей

Стоит ли подробно говорить о книге, содержание которой известно миллионам детей и взрослых во всем читающем мире. Истории о Маугли входят в нашу жизнь примерно в том возрасте, в каком он попал в джунгли. Скажем спасибо за этот шедевр Редъярду Киплингу и, несмотря на его нелюбовь к нашей стране, отдадим должное его таланту. И, разумеется, посмотрим как видит эту историю нейросеть.

Маугли в нежном возрасте.
Маугли в нежном возрасте.

Очень неплохо и, кажется, близко к тексту: и джунгли, и загорелый лохматый мальчишка. Правда, напрягает ключица, будто после нескольких переломов, но могло быть и хуже. Посмотрим на других ключевых героев.

Лучший педагог джунглей.
Лучший педагог джунглей.

Один из самых преданных и близких друзей Маугли - медведь Балу. Вот такой получился портрет с первого раза и искать что-то лучше не было смысла, ведь известно: лучшее - враг хорошего. Кажется, в этом случае нейросеть прекрасно понимала, о чём идёт речь.

Багира: он или она?
Багира: он или она?

Пантера по имени Багира тоже вышла довольно натурально и тоже с первого раза. Есть сомнения по поводу цвета глаз, но в этом конкретном случае, как кажется, они картину не портят.

Змей или дракон?
Змей или дракон?

А здесь, разумеется, великий и смертельно опасный питон Каа. Вот только его внешний вид вызывает недоумение, ну или, по крайней мере, вопросы. Нос у него явно не змеиный, а главное - усы! Насколько помню, с похожими усами обычно изображают китайских драконов. Нет, такой Каа нам не нужен! Попробуем другие варианты.

Вы слышите меня, бандарлоги?
Вы слышите меня, бандарлоги?

Ну вот, можете ведь, когда захотите! Здесь питон Каа, может, и не идеальный, но хоть не похож на ползающего сома.

Хозяин джунглей.
Хозяин джунглей.

Ну, как же без главного антагониста? Вот и Шерхан, нарисованный нейросетью. Как и следовало ожидать, исполнено неплохо, если пристально не всматриваться, то можно не заметить, что пальцев на тигриной лапе многовато.

Выводы: как и в предыдущей истории, видно, что нейросеть знакома с книгой, но так же поверхностно. Главных персонажей она узнаёт, но только по одиночке. Все попытки получить изображение группы героев (например: Маугли с Балу и Багирой или Шерхана с Табаки) наталкиваются на барьер непонимания. Кроме того, при довольно таки приличном изображении у героев напрочь отсутствуют эмоции, вспомним хотя бы потрясающий советский мультсериал о Маугли - там даже Каа был внешне эмоционален.

Продолжение очень скоро!