"Я просто беру глыбу мрамора и отсекаю все лишнее, пока помощники не получат скульптуру с Алиэкспресса"
Зураб Микеланджелович Цифровители
Абсолютно невозможно предугадать, какие ошибки сделает нейросеть в простом вроде бы задании. Поэтому там, где робот будет рисовать картинки вместо человека, сразу появится другой человек, чтобы контролировать чугунного инвалида и заставлять его переделывать работу заново. Вот, например, как работает новейшая нейронка "Stable Diffusion 2.0":
Всего-то лишь - перепутала кто и кого рисует. Главное, джинсы на месте. Или вот такое:
Подумаешь, великая ошибка. Может, это пассажир такой - с куском руля в руке? Гораздо интереснее, когда ошибка такая тонкая, что второпях можно и пропустить:
Котенок, кролик - какая тебе разница, кожаный мешок? Вас много, я одна.
Самое слабое место генераторов "текст-картинка" всегда было в придании позы человеческому телу. Удивительно, что эту возможность вообще не отключают принудительно, ведь результаты через один вот такие вот:
И вот еще:
Даже когда робот старается изо всех сил:
Ноги есть, они в джинсах, они стоят, и даже мокрый асфальт на месте. Фуууух, человек, отстань - я все для тебя сделал!
Дело в том, что нейросеть обучают на большом, но конечном множестве картинок, к которым есть текстовое описание. Если в обучающем наборе была картинка, очень похожая на задание - результат будет блестящий. Но стоит немного отступить в сторону, и получите адовый треш:
Ну, не знает чугунявый робот про сказки с джиннами, и не видел, как они в воздухе плавают. Правда, откуда недо-Терминатор взял гроб плавающий, все равно непонятно.
Также очень плохо получается у нейронок комбинировать предмет, качество и действие:
Особенно если добавить в задание дополнительное условие:
Я бы на такого коня не стал садиться. И еще:
Лицо персонажа как бы намекает, что издевательства над роботами когда-то будут жестоко наказываться.
Ну и всегда может оказаться, что в самом безобидном случае из недр компьютера вырвется что-то похуже "Сеятеля" Остапа Бендера:
Увеличиваем градус безумия:
С изображением техники на удивление все так же плохо (сразу вспоминаются "фрактальные кукумберы" из BirchPunk-а):
Сюжеты сказок я уже пробовал, но вот вам еще:
Почему вы недовольны? Царевна-лягушка была же, пусть будет король-лягушка.
А когда у робота сносит голову вообще, можно получить просто мусор: