Найти тему
Антикварная Кубань

Почему ИИ рисует не исторические, а фэнтези изображения

Основные сервисы искусственного интеллекта разрабатывались в иностранном сегменте интернета. И вполне очевидно, что как наиболее модное течение, фэнтези в процессе обучения ИИ играло большую роль. Поэтому не стоит удивляться, почему при запросе "воин 11-12 веков, в полном вооружении" вы сможете получить изображение латника 14-15 веков, да ещё в максимилиановском полном доспехе.

Не умеет ещё нейросеть соблюдать точное следование эпохам, а иногда формирует сборную солянку из оружия и доспехов разных эпох. Иной раз и античностью нас может побаловать, хотя нам было интересно средневековье. Поэтому при работе с изображениями приходится совершать очень много манипуляции и текстовых поправок, что на выходе может появиться полноценный роман, а не запрос к искусственному помощнику.

Изображение рыцаря.
Изображение рыцаря.

Не знаю, насколько такой образ соответствует образу рыцаря XI - XII веков, но вот такой итог мы получили. Кольчуга, мне кажется, в области шеи получилась не совсем достоверно. Другой эксперимент я решил провести с образами мушкетёров. В интернете очень много картинок по этой тематике и тем более по знаменитому роману Александра Дюма "Три мушкетёра". Основа для создания есть.

Изображение мушкетеров по мнению ИИ
Изображение мушкетеров по мнению ИИ

В итоге получилось вот такое изображение. Да, запрос я сделал по локации в Москве. Тут всё правильно. Но вот с костюмами опять какой-то микс. Может быть, с древностью проблем у ИИ не будет? Замечу, что русскую древность века эдак XII - XIII вообще нейросеть не понимает и может подсунуть даже краснокирпичный Кремль.

Изображение от ИИ Древний Египет.
Изображение от ИИ Древний Египет.

А вот Древний Египет. Все вроде соответствует тому периоду времени. Хотя и выглядит как Голливудская постановка 50-60-х годов прошлого века. Красочно и в соответствии со множеством изображений художников, которые также, как и ИИ идеализировали тот период времени. На мой взгляд, изображения соответствуют нашему восприятию того времени. Но не реальности.

Изображение фараонов Древнего Египта.
Изображение фараонов Древнего Египта.

Более или менее достоверно нейросеть может создать гравюру. Например, XV-XVI века. Её уже трудно будет отличить от настоящей, и я думаю, можно использовать в качестве иллюстрации статьи по истории.

Изображение ИИ, как гравюра XV века.
Изображение ИИ, как гравюра XV века.

Какой можно сделать вывод? Нейросети сейчас только обучаются. И я думаю, запросов по теме истории в данный момент приходит мало, в основном запрашивается фэнтези. Поэтому ИИ иногда теряется и мешает все эпохи в одну кучу. Пройдёт немного времени и каждый автор сможет сгенерировать вполне достоверное историческое изображение в любом качестве.

Изображение ИИ.
Изображение ИИ.

Чем не помощь для авторов на Дзен. Я же пока остановился на одном из сервисов. Не знаю, на какой базе они генерируют изображения. Но Aiserch выдаёт более качественные и достоверные изображения. Но это, на мой взгляд. Знаю, что многим удается в любой нейросети добиться результатов даже с сотых запросов. А что думаете вы, друзья? Напишите в комментариях. Поддержите нас подпиской, репостом и лайком!