Добавить в корзинуПозвонить
Найти в Дзене
Территория смысла

Шедевры абсурда: заставляем нейросеть рисовать капибару-самурая

Абсурд — лучший стресс-тест для любой генеративной модели. Когда вы просите что-то реалистичное, нейросеть просто достаёт из памяти готовый шаблон. А вот когда запрашиваете что-то, чего никогда не существовало, она вынуждена импровизировать. И тут начинается самое интересное. Мы взяли Ideogram 3.0 и Midjourney V7 и закинули им несколько промптов с совершенно бессмысленными на первый взгляд концепциями. Ideogram справился на удивление неплохо. Капибара действительно оказалась в доспехах, с катаной. Борщ — красный, марсианский пейзаж — рыжий. Но вот с борщом вышла забавная история: нейросеть упорно рисовала его как красный суп в миске, без характерной свекольной густоты. То ли посчитала это неважным, то ли борщ для неё — просто «красный суп». Midjourney пошёл дальше и добавил капибаре эпичный фон с марсианскими горами. Проблема: борщ он превратил в нечто, отдалённо напоминающее рамен. Лапша, свисающая из пасти капибары, — это было неожиданно. Здесь обе модели показали характер. Midjourne
Оглавление

Шедевры абсурда: заставляем нейросеть рисовать капибару-самурая

Абсурд — лучший стресс-тест для любой генеративной модели. Когда вы просите что-то реалистичное, нейросеть просто достаёт из памяти готовый шаблон. А вот когда запрашиваете что-то, чего никогда не существовало, она вынуждена импровизировать. И тут начинается самое интересное.

Мы взяли Ideogram 3.0 и Midjourney V7 и закинули им несколько промптов с совершенно бессмысленными на первый взгляд концепциями.

«Капибара-самурай ест борщ на Марсе»

Ideogram справился на удивление неплохо. Капибара действительно оказалась в доспехах, с катаной. Борщ — красный, марсианский пейзаж — рыжий. Но вот с борщом вышла забавная история: нейросеть упорно рисовала его как красный суп в миске, без характерной свекольной густоты. То ли посчитала это неважным, то ли борщ для неё — просто «красный суп».

Midjourney пошёл дальше и добавил капибаре эпичный фон с марсианскими горами. Проблема: борщ он превратил в нечто, отдалённо напоминающее рамен. Лапша, свисающая из пасти капибары, — это было неожиданно.

«Грустный бородатый хакер в средневековых латах программирует на Fortran в замке с привидениями»

Здесь обе модели показали характер. Midjourney нарисовал отличного хакера в латах с ноутбуком, но привидения вышли уж слишком карикатурными — почти мультяшные. Зато Ideogram отличился: борода у хакера получилась роскошной, Fortran превратился в экран с зелёным кодом (хотя Fortran давно не зелёный), а призраки смотрелись вполне атмосферно.

«Космический ковбой играет на укулеле для инопланетных осьминогов в баре на Сатурне»

Самый зрелищный промпт. Midjourney выдал потрясающую картинку с кольцами Сатурна на заднем плане. Осьминоги выглядели слегка озадаченными — то ли музыка им не нравится, то ли укулеле их смущает. Ideogram сделал акцент на баре, но осьминоги получились скорее как кальмары — модель явно перепутала головоногих.

Как это работает — на пальцах

Когда вы даёте генератору картинок странный промпт, происходит следующее. Нейросеть не «понимает» смысл слов — она работает с паттернами. Каждое слово в промпте — это сотни ассоциаций, извлечённых из обучающих данных. «Капибара» — значит «большой грызун», «вода», «баня» (да, они ассоциируются с баней в интернете). «Самурай» — значит «доспехи», «катана», «японская эстетика».

Задача модели — собрать эти паттерны в одно изображение. И чем абсурднее запрос, тем больше «стыков» между мирами — а значит, тем больше пространства для творческих ошибок.

Практически это значит следующее: чем необычнее ваш запрос, тем выше шанс, что модель «дорисует» что-то своё. Это не баг — это особенность. Она пытается заполнить пробелы в вашем абсурдном ТЗ.

Что мы выяснили

Midjourney V7 лучше справляется с атмосферой и эмоциями, но иногда теряет детали объектов. Ideogram 3.0 точнее в деталях, но хуже выстраивает композицию. И тот, и другой периодически «фантазируют» — и это, как ни странно, делает их ближе к настоящему творчеству.

Главный вывод

Абсурдные промпты — это не развлечение. Это окно в то, как нейросеть на самом деле видит мир: через паттерны, ассоциации и статистику. И в этом окне иногда открываются совершенно неожиданные пейзажи.

А какие безумные промпты получались у вас? Пробовали ли вы заставить генератор нарисовать что-то совсем нереальное?