Найти тему

Ужас нейросетей генерации картинок

Я решил выложить в блог кусочек текста своего сценария (фантастической комедии "Марсианская проблема: жуши-муши бублик"). Он связан с инопланетянами и я захотел подобрать подходящую картинку.

Для начала я попробовал поисковые системы. Для этого я использовал запрос:

зелёнокожий учитель с булавой убивает зеленокожего тинейджера в марсианском классе

Это действительно хорошо описывает сцену, но я не получил ни одной толковой картинки. Яндекс честно показывал зеленокожих людей, но сценку изобразить не смог. 

Гугл вообще предложил заменить зеленокожих на чернокожих, а когда я настоял на своей версии, сказал, что у него нет вариантов.

Тогда я воспользовался нейросетями. Запрос:

old man with green skin with mace beats teenager with green skin in the martian classroom

Но и искусственный интеллект не помог:

Dall-E

Зелёный инопланетянин стоит рядом с пожилым человеком с зелёным шампунем
Зелёный инопланетянин стоит рядом с пожилым человеком с зелёным шампунем

Инвалид в зелёном халате бьёт себя по лбу световым мечом
Инвалид в зелёном халате бьёт себя по лбу световым мечом

Davinci

Зелёный старик накалывает на шампур зелёного человека
Зелёный старик накалывает на шампур зелёного человека

Мужик в скафандре неправильно понял выражение девушка-огонь
Мужик в скафандре неправильно понял выражение девушка-огонь

И это при том, что сделать программу генерации картинок совсем несложно, нужно только отказаться от нейросетей и просто честно накладывать объекты на окружение (лучше 3d, но и вариант с 2d тоже неплох).