В последнее время стали очень популярными различные нейросети, которые могут самостоятельно выполнять самые разные творческие задачи. Насколько самостоятельно? Считается, что они обладают собственным, хотя и искусственным, интеллектом.
Сейчас на многих ресурсах выкладываются результаты работы нейросетей, например: как ИИ видит города России в человеческом образе. Наверное будет интересно посмотреть, как нейросеть проиллюстрирует широко известные и любимые в нашей стране детские книги. Произведения выбирались рандомно и порядок их расположения в списке - произвольный. Десять из сотен и тысяч любимых с детства книг с иллюстрациями от искусственного художника.
Поехали!
Алиса в Стране чудес
Шедевр на все времена, написаный в 1865 году прозаиком и математиком Чарльзом Лютвиджем Доджсоном, известным всему миру любителей Алисы под псевдонимом Льюис Кэрролл. У нас нет возможности показать всех персонажей из историй про Алису, но на некоторых мы посмотрим через призму ИИ.
Шляпник, пожалуй, выглядит неплохо, вполне узнаваем, благодаря главному атрибуту. Подспудно казалось, что он будет напоминать Джонни Деппа из достойной экранизации, но нейросеть решила, что Ник Кейв в образе Шляпника смотрится лучше.
А вот Алиса удалась не очень. Все же, сказка про маленькую девочку, а не про ветерана боёв с постылой жизнью, бытовухой и алкоголем.
Чеширский кот выглядит немного пугающе, но Алиса спокойна, значит, кот только делает вид, что он страшный. А не Маша ли Распутина послужила моделью для этой иллюстрации?
Обе особы напряжены, атмосфера наэлектризована. Вопрос только в том, кто из них Алиса, а кто Красная королева. Видимо, для нейросети это тоже загадка и она, не мудрствуя лукаво, нарядила обеих в красное и выдала каждой по короне. Так что, кто есть кто - думайте сами, решайте сами.
А эта иллюстрация, сделанная в стиле «рисунок карандашом», на мой субъективный взгляд, удалась лучше всего - мы видим милую маленькую девочку, примерно того возраста, какого и должна быть настоящая сказочная Алиса. И очень надеюсь, что у неё на голове большие красивые банты, стилизованные под крылья бабочки, а не уши.
Выводы: нейросеть знает сказки про Алису достаточно неплохо, но не воспринимает их как детские произведения и рисует иллюстрации исходя из собственной оценки содержания. Сеть узнаёт не всех персонажей и иногда не может понять, чего от неё хотят. В целом, если не рассматривать картинки под микроскопом, то создаётся неплохое впечатление о её работе.
Приключения Тома Сойера
Одна из самых известных детских книг во всём мире, написанная знаменитым американским писателем Сэмюэлем Клеменсом, более известном как Марк Твен. В нашей стране всегда была очень популярной и, полагаю, остаётся такой и сегодня. Приключения предприимчивого мальчишки, в котором угадывается сам автор, в маленьком американском городке на великой реке Миссисипи. Вот как видит эту замечательную повесть нейросеть:
Нейросеть почему-то посчитала, что Том и Гек, если не двойняшки, то уж точно братья. Возможно, она пока не научилась понимать, что кроме имён у людей есть ещё и фамилии и ей кажется, что Том Сойер - имя. Зато одеты они почти в соответствии с эпохой, ну, если не придираться к тому факту, что Гек должен выглядеть как оборванец.
Попробовал немного изменить запрос, добавив данных, конкретизировав их, а ещё поменял стиль. И вот вам результат - те же братья-близнецы. Ну и придерусь к форме одежды - джинсовые комбинезоны все же рабочая одежда фермеров, а Том и Гек парни городские, жили в целом Санкт-Петербурге (их, вроде, в США несколько). Хотя, рисунок для машины с интеллектом очень даже неплох. Ловлю себя на мысли, что пока "рисунок карандашом" нравится мне больше всего.
Говорить о Томе Сойере и не вспомнить о Бекки Тетчер - нонсенс. Удивительно, но нейросеть выдала этот вариант с первого раза. Конечно, на этой иллюстрации Бекки одета, скажем так, слегка свободно. Мы-то знаем, что она дочь судьи, одного из первых людей города и такого легкомыслия позволить себе не может. Но ИИ такие тонкости, видимо, пока не доступны (ключевое слово - пока).
Это - индеец Джо! По крайней мере, нейросеть считает, что он должен выглядеть именно так. По мне, так он больше похож на Пятницу Робинзона Крузо. Ну и по выражению лица не скажешь, что этот парень отъявленный бандит. Ладно, попробуем скорректировать запрос, может, будет другой результат, поближе к первоисточнику.
Изменения есть, но не принципиальные - теперь, конечно, черты лица более суровые, но индейского ничего не появилось. Как были Карибы, так и остались. Сеть исходит из какой-то своей логики, для нас, людей, увы непостижимой.
А напоследок давайте посмотрим, как ИИ изобразит ещё одного героя - Гекльберри Финна, но без Тома Сойера, а с негром Джимом. Скажу сразу, по запросу про Гека и Джима выдавались результаты, странные до изумления, но с пятого или шестого раза получилось хоть что-то приличное.
На мой взгляд, здесь недостаток один - Джим выглядит как ровесник Гека, хотя, мы знаем, что в книге Джим - мужчина среднего возраста, а Гек Финн мальчик примерно 12-13 лет. Выражение лиц у них, будто бы они провожают свой любимый цирк. Но, по крайней мере, на этой иллюстрации изображены люди, в отличие от тех, что мне предлагались вначале.
Выводы: нейросеть знает об этой книге очень мало, но достаточно, чтобы описать её героев хотя бы отдалённо. В глаза бросается однотипная одежда и перебор с количеством близнецов. Представленные выше результаты, при небольшой корректировке могут даже украсить её новое издание.
Книга джунглей
Стоит ли подробно говорить о книге, содержание которой известно миллионам детей и взрослых во всем читающем мире. Истории о Маугли входят в нашу жизнь примерно в том возрасте, в каком он попал в джунгли. Скажем спасибо за этот шедевр Редъярду Киплингу и, несмотря на его нелюбовь к нашей стране, отдадим должное его таланту. И, разумеется, посмотрим как видит эту историю нейросеть.
Очень неплохо и, кажется, близко к тексту: и джунгли, и загорелый лохматый мальчишка. Правда, напрягает ключица, будто после нескольких переломов, но могло быть и хуже. Посмотрим на других ключевых героев.
Один из самых преданных и близких друзей Маугли - медведь Балу. Вот такой получился портрет с первого раза и искать что-то лучше не было смысла, ведь известно: лучшее - враг хорошего. Кажется, в этом случае нейросеть прекрасно понимала, о чём идёт речь.
Пантера по имени Багира тоже вышла довольно натурально и тоже с первого раза. Есть сомнения по поводу цвета глаз, но в этом конкретном случае, как кажется, они картину не портят.
А здесь, разумеется, великий и смертельно опасный питон Каа. Вот только его внешний вид вызывает недоумение, ну или, по крайней мере, вопросы. Нос у него явно не змеиный, а главное - усы! Насколько помню, с похожими усами обычно изображают китайских драконов. Нет, такой Каа нам не нужен! Попробуем другие варианты.
Ну вот, можете ведь, когда захотите! Здесь питон Каа, может, и не идеальный, но хоть не похож на ползающего сома.
Ну, как же без главного антагониста? Вот и Шерхан, нарисованный нейросетью. Как и следовало ожидать, исполнено неплохо, если пристально не всматриваться, то можно не заметить, что пальцев на тигриной лапе многовато.