558 подписчиков

Битва интеллектов: "Шедеврум" против "Кандинского", раунд 14

8 июня 20238 июн 2023

7 мин

Впадаем в детство Сегодняшний этап бесконечного соревнования между двумя нейросетями за право называться лучшим (и наиболее адекватным, что важно) художником - в общем-то, просто частный случай раунда 12. Как и тогда, сегодня модели "Шедеврум" и "Кандинский" будут рисовать обычные повседневные предметы, так что я буду оценивать в первую очередь понимание ими задачи и точность передачи деталей - это важнее, чем общее эстетическое впечатление. Особенность в том, что на этот раз ИИ будет рисовать только детские игрушки. Тут можно было бы притянуть за уши прошедший День защиты детей, но не буду. Игрушки - просто потому, что мне так захотелось, вот и всё. Начинаем играть. Запрос: резиновая уточка. Лично у меня четыре резиновых уточки, и я этого не стыжусь. Ванны с ними я не принимаю, но своим существованием они привносят солнечную радость в мои будни. Особенно уточка в образе Дарта Вейдера. За исключением него, остальные выглядят плюс-минус как вариант "Шедеврума", а вот такие реалистичные

Впадаем в детство

Сегодняшний этап бесконечного соревнования между двумя нейросетями за право называться лучшим (и наиболее адекватным, что важно) художником - в общем-то, просто частный случай раунда 12.

Как и тогда, сегодня модели "Шедеврум" и "Кандинский" будут рисовать обычные повседневные предметы, так что я буду оценивать в первую очередь понимание ими задачи и точность передачи деталей - это важнее, чем общее эстетическое впечатление.

Особенность в том, что на этот раз ИИ будет рисовать только детские игрушки. Тут можно было бы притянуть за уши прошедший День защиты детей, но не буду. Игрушки - просто потому, что мне так захотелось, вот и всё.

Начинаем играть.

Запрос: резиновая уточка.

Лично у меня четыре резиновых уточки, и я этого не стыжусь. Ванны с ними я не принимаю, но своим существованием они привносят солнечную радость в мои будни. Особенно уточка в образе Дарта Вейдера. За исключением него, остальные выглядят плюс-минус как вариант "Шедеврума", а вот такие реалистичные, как у "Кандинского", мне не попадались. Но! Это не значит, что их не существует, и, на счастье "Кандинского", я не обращаю внимания на совершенно неестественно застывшую ямку в воде. Вот совсем не обращаю внимания. Никакого.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: плюшевый медведь.

У "Шедеврума" с первого взгляда можно даже не заметить огрехов и принять изображение за настоящую фотографию. Ошибки есть, конечно, но небольшие и простительные. Отличная работа.

Мишка "Кандинского" кривоват, но попробуйте мне сказать, что вы никогда таких китайских зверей в реальности не видели - не поверю. И потом, красота тут - не главное. Для кого-то и он мог бы стать любимой игрушкой.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: игрушечные кубики

Вы же помните, что я оцениваю понимание задачи и точность передачи деталей? Понимание здесь есть у обеих нейросетей, а с точностью наблюдаются проблемы. Тоже у обеих. Но у "Кандинского" - больше. Его кубики можно смело отправлять назад производителю с гневным письмом, потому что это явный брак. Хотя в магазине они бы стоили наверняка дороже пухляшей "Шедеврума".

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: формочки для песка и игрушечный совок.

"Шедеврум" попытался подкупить меня заманчивой сценой из отпуска, но со мной такие трюки не работают. Где совок?

"Кандинский" повёл себя честнее и не стал отвлекать внимание от того факта, что и он тоже понятия не имеет, как выглядит игрушечный совок. Два стакана сойдут за формочки, остальное похоже на детали поломанных игрушек. К слову, такое в песочницах тоже не редкость.

Дополнительные тесты показали, что обе нейросети в самом деле не знают, что такое совок вообще, не обязательно игрушечный. В этой ситуации даже формочки их не спасут: задание не выполнено, а прокол с совком запишу в маленькую красную книжечку.

Результат: "Шедеврум" - 0, "Кандинский" - 0.

Запрос: игрушечная машинка.

И не придерёшься ведь к "Кандинскому". Это машина? Машина. Маленькая и ненастоящая? Получите: игрушечная машинка.

Хорошо, сформулируем иначе.

Уточняющий запрос: игрушечный автомобиль.

Вот теперь двусмысленностей нет. "Шедеврум" оба раза предлагал разные варианты, но эта модель мне понравилась больше всего. Тёплая-ламповая, и ржавчина такая винтажная, знаете.

Машинка Леонардыча, даром что кривая, выглядит мило и маленьким детям наверняка понравилась бы. Балл он снова получает, но запомним на будущее, что для полного взаимопонимания с "Кандинским" может потребоваться очень тщательный подбор слов.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: воздушный змей.

Ленты, шнуры и верёвки для нейросетей ещё хуже пальцев. Начинаются и заканчиваются в воздухе, изгибаются под странными углами и меняют толщину без предупреждения. Если смотреть на это обстоятельство сквозь пальцы (ха-ха), то в остальном упражнение можно засчитать. "Кандинский" в конструкции змея использовал неортодоксальный инженерных подход, но в Китае, опять же, ещё и не такое сооружают.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: неваляшка.

Опаньки. Вот вам и неваляшка! Тут даже формочками не прикроешься: по причине полного непонимания нейросетям пришлось рисовать хоть что-нибудь. Что странно, потому что даже при переводе "неваляшки" на английский, даже гуглопереводчиком, никакой двойственности смыслов не возникает.

Хорошо, вспомним урок с машинкой и уточним запрос.

Уточняющий запрос: кукла-неваляшка.

Не помогло. "Шедеврум" узнал слово "кукла", но этого недостаточно. "Кандинский" его тоже узнал, но изобразил зачем-то кукольный дом. Попробую синонимы и английский (собственно, из всех синонимов мне известен только "ванька-встанька").

Уточняющие запросы: ванька-встанька; roly-poly.

Судя по всему, эту милую индейскую блондинку зовут Иванка (или Вианнка). Результат генерации по запросу "ванька-встанька", "Кандинский" 2.1

Roly-poly, "Кандинский" 2.1. Если бы не шипастые плавники, мог бы сойти за неваляшку.

Так ванек-встанек представляет себе "Шедеврум" 0.2.0. То есть никак не представляет.

Это провал, Штирлиц. Похоже, что обе модели никогда не видели не только совки, но и неваляшек. Большой пробел в образовании. Где там моя красная книжечка?

Результат: "Шедеврум" - 0, "Кандинский" - 0.

Запрос: игрушечная деревянная лошадка.

Ну хоть здесь всё предсказуемо. Лошадь "Кандинскому" стругал какой-то авангардист, но всё же это лошадь, хоть качаться на ней и невозможно. Зато можно кататься с горки зимой. Особенно если сесть на неё задом наперёд. Стоило бы за это влепить неуд, но после неваляшек я понимаю, что всё познаётся в сравнении.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: игрушечные ковбои.

В моём детстве пластмассовые ковбои были другие. Можете посмотреть в любом поисковике, какие, потому что точно такие же были ещё у миллионов детей в нашей стране, и фотографий этого легендарного набора полон интернет. Но и эти пугающие человечки с расползающимися лицами вполне соответствуют определению, хоть и прискакали прямиком из ночных кошмаров. Поэтому, зажмурившись, присуждаю каждому по баллу.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: юла.

Нет, ну это уж слишком. За все предыдущие тринадцать раундов (и парочку бонусных) не было ещё такого, чтобы нейросети так проваливали задание, да ещё не одно, а сразу три!

"Шедеврум" выдаёт наборы красавиц самой разной этнической принадлежности, включая эльфов (судя по последним переписям населения, это наше нацменьшинство). При этом предпочтение почему-то отдаётся азиатско-тихоокеанскому типу. Тем не менее ни одна из них не является юлой, что обидно.

"Кандинскому" тоже обидно, что он опять чего-то не знает, и я начинаю подозревать, что свою обиду он недвусмысленно изобразил на лице желтоглазой девушки с подписью Yula. Нет, дружище, это не юла.

Хорошо, уточняю запрос.

Уточняющие запросы: игрушка юла; волчок.

"Шедеврум" 0.2.0, результат генерации по запросу "игрушка юла".

"Шедеврум" 0.2.0, результаты генерации по запросу "волчок".

"Кандинский" 2.1. Результат генерации по запросу "игрушка юла".

Не помогло.

Волчок "Кандинского" прекрасен, но как хищник, а не как юла. Вторая картинка нейросети просто вызывает у меня приступ жалости. Бедная программа искренне старалась выполнить задачу в отсутствие нужной информации, поэтому подобрала максимально похожее на "юлу" слово, которым для неё показалась "ёлка". Во всяком случае, это единственное здравое объяснение появлению недовольного двурогого Санты под ёлочкой.

Объяснить картинки "Шедеврума" я, пожалуй, не смогу. Его логические цепочки, если они и есть, уходят в такую даль, что у меня нет сил их распутывать.

Последний шанс найти взаимопонимание: запрос на английском языке.

Уточняющий запрос: spinning top.

А вот ещё три варианта по этому же запросу.

Ага! Кажется, ИИ что-то начал понимать. Он всё ещё не очень уверен в точной конструкции игрушки, но до него как минимум дошло, о чём я толкую.

"Шедеврум" догадался, что что-то должно вращаться, но игрушка это, казиношная рулетка или водоворот - вопрос для него пока сложный. "Кандинский" оказался сообразительнее и понял, чего я добиваюсь, но нарисовать это, увы, толком не смог.

Хорошо. Может, юла - непопулярная и старомодная игрушка, и в этом всё дело? Может, попробовать что-то посовременнее?

Дополнительный запрос: спиннер.

"Шедеврум" 0.2.0. А вот и искомый волчок!

Вот оно что, "Шедеврум". Ключ к пониманию - слово "спиннер", которым ты обзываешь не только безделушку с самой яркой и короткой карьерой в истории безделушек, но и - внимание - волчок. Который юла.

(Ну и ещё пару странных вещей.)

"Кандинский", очевидно, проспал эпоху увлечения спиннерами, и вообще, устал уже от этих запросов. Я тоже. Закрываем тему волчков.

Результаты: "Шедеврум" - 0, "Кандинский" - 0.

Общий результат: "Шедеврум" - 7, "Кандинский" - 6.

Результат по итогам 14 раундов: "Шедеврум" - 114, "Кандинский" - 100.

Это было долго и мучительно для всех. Оказывается, добиться адекватного ответа от нейросетей иногда бывает очень сложно, даже если где-то в глубине своего кибермозга они этот ответ знают. Нужно искать обходные пути, другие формулировки, даже переходить на более понятный язык. Тогда есть шанс найти взаимопонимание.

А с людьми разве не так же?