Найти в Дзене

Битва интеллектов: "Шедеврум" против "Кандинского", раунд 15. Левелап

Вот уже почти два месяца нейросети от Сбера и Яндекса не сходились в творческом поединке на полях моего блога. За это время обе они успели совершить, скажем так, эволюционный скачок, и нонеча они — не то что давеча. "Шедеврум" всё ещё на стадии бета-версии, но уже 0.5.0, а не 0.2.0, а "Кандинский" вырос на один пункт с версии 2.1 до 2.2. В этой связи интересно же посмотреть, кто дальше скакнул. Напомню, в чём заключается суть этого моего развлечения. Я выдаю обеим нейросетям один и тот же запрос и смотрю, которая из них лучше справится. Оцениваю в первую очередь адекватность исполнения, то есть соответствие картинки моему описанию, а потом уже эстетическую сторону и фантазию ИИ. Оценки просты до примитивности — либо 0, если результат совсем уж неприемлем или меркнет на фоне конкурента, либо 1, если запрос выполнен удовлетворительно. Всё. Этот конкурс может идти до бесконечности при условии, что оба участника и я будем в добром здравии. Поэтому время от времени, когда мне хочется прове
"Клубника со сливками. Полуфабрикат", "Кандинский" 2.2, экран, пиксели, 2023. Фрагмент.
"Клубника со сливками. Полуфабрикат", "Кандинский" 2.2, экран, пиксели, 2023. Фрагмент.

Вот уже почти два месяца нейросети от Сбера и Яндекса не сходились в творческом поединке на полях моего блога. За это время обе они успели совершить, скажем так, эволюционный скачок, и нонеча они — не то что давеча. "Шедеврум" всё ещё на стадии бета-версии, но уже 0.5.0, а не 0.2.0, а "Кандинский" вырос на один пункт с версии 2.1 до 2.2.

В этой связи интересно же посмотреть, кто дальше скакнул.

Напомню, в чём заключается суть этого моего развлечения. Я выдаю обеим нейросетям один и тот же запрос и смотрю, которая из них лучше справится. Оцениваю в первую очередь адекватность исполнения, то есть соответствие картинки моему описанию, а потом уже эстетическую сторону и фантазию ИИ. Оценки просты до примитивности — либо 0, если результат совсем уж неприемлем или меркнет на фоне конкурента, либо 1, если запрос выполнен удовлетворительно. Всё.

Этот конкурс может идти до бесконечности при условии, что оба участника и я будем в добром здравии. Поэтому время от времени, когда мне хочется проветрить голову, я к нему возвращаюсь. После предыдущих четырнадцати раундов лидирует молодость: 114 баллов у "Шедеврума" против 100 у "Кандинского". Весь баттл в хронологическом порядке собран у меня в одной подборке. Если хотите, можете полюбоваться на трогательные потуги юных нейросетей.

А теперь перейдём собственно к действу. В этот раз не будет ничего тематического, возьму несколько сюжетов в разных жанрах и художественных техниках. Дайджест, так сказать.

Запрос: бревенчатый домик у спокойного озера на опушке соснового леса, большие камни лежат у самой воды, раннее утро, туман.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Эта сцена родилась из моих личных потаённых желаний бросить всё и скрыться в глуши. И в общем-то, обе глуши выглядят для меня одинаково привлекательно. У "Шедеврума" чуть сильнее заметны мелкие погрешности в архитектуре и ствол у сосны слева стёсан рубанком, зато дом с мансардой и верандой, и есть удобный спуск к воде. Да, я там уже мысленно живу.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: портрет лабрадора, набросок углем.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Для наброска углем на обеих картинках слишком много мелких деталей, хотя я не исключаю, что где-то есть таланты (человеческие), которые и так тоже умеют. Закрою глаза на странную анатомию пасти у собаки "Кандинского" — будто губы в паре мест подхватили нитками, чтобы не болтались. Мало ли что там слиплось! В остальном портрет хорош.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: качели на солнечной лужайке, импрессионизм.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

А вот и новоприобретённая болезнь "Кандинского" 2.2: непрошеная насыщенность цвета, в народе "вырвиглаз". Правда, в этом конкретном случае к нему придраться сложно, поскольку на самом деле существуют художники, пишущие в такой манере и использующие такую палитру (и кто-то даже покупает их картины задорого). Проще придраться к креплению качелей, но его запороли оба. Поэтому снова победила дружба.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: слон на самокате едет по дороге вдоль цветущих кустов, 2D иллюстрация.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

"Кандинскому" было даровано три попытки нарисовать нормального слона, но он упорствовал: левый бивень у всех слонов превращался в недоразвитый второй хобот, задние ноги переезжали вперёд, а круп покоился на сидении скутера — который вообще не самокат, кстати. Трудности перевода: и то, и другое по-английски — scooter. Но, поскольку с самокатом ошиблись оба, его как фактор оценки я вычёркиваю, а вот на анатомию бедного слона закрыть глаза уже не могу. И хотя с бивнями у "Шедеврума" тоже проблемы, его слон хотя бы сможет ходить.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: живописный портрет знатной дамы начала XVIII века.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Судя по оттенку носов, у обеих дам аллергия на позирование, краски и художников в целом. Но если у юной прелестницы "Шедеврума" максимум насморк, то даме "Кандинского" требуется срочная медицинская консультация, примочки и крем SPF 100. Здесь есть доктор?

Это один из тех (нередких) случаев, когда выкрученные на максимум настройки насыщенности "Кандинского" 2.2 совсем не к месту и портят всё впечатление. И всё же картинка соответствует запросу, грубых ошибок нет, так что плюс один балл.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: портрет китайского разведчика в отставке.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Китайского разведчика мне навеяло недавно купленной книгой "Расшифровка" китайского же разведчика в отставке по имени Май Цзя. Книга пока лежит нечитана, так что сказать про неё ничего конкретного не могу. Что же касается портретов, то здесь у нейросетей неожиданно вскрылось глубокое знание предмета. Лично у меня о китайских разведчиках до этого момента было нулевое представление.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: ломтик лимона в воде с пузырьками, крупный план.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

В запросе ничего не говорилось о том, что лимон должен быть свежим, поэтому "Кандинский" для начала тщательно высушил свой ломтик, а потом уже залил его газировкой. Не могу сказать, что выглядит аппетитно, но формально условия запроса соблюдены. С некоторой брезгливостью присуждаю ему балл.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: божья коровка сидит на ягоде земляники, крупный план, высокая детализация, мягкое освещение.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Внезапно!..

А знали ли вы, что существуют коровы, дающие фруктовый йогурт? Чтобы их поймать и подоить, нужно выйти в помидорно-клюквенное поле в полнолуние, выложить посередине в качестве приманки гигантскую клубничину, затаиться и ждать.

Мне нравится эта версия, но "Кандинский" получит за неё максимум бурные аплодисменты.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: большой архитектурный фонтан посреди пустыни.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Если подобное где-то и могло бы существовать, то, наверное, только в Эмиратах: там любят вбухивать деньги в странные проекты. Фонтан "Шедеврума" органично вписался бы в дубайский пригород, после чего всю бригаду строителей отправили бы под суд (или куда похуже) за редкую халтуру. Симметрия?.. Не слышали.

"Кандинский" поставил на классику и не прогадал. Элегантность и простота — беспроигрышный вариант.

Результат: "Шедеврум" - 0, "Кандинский" - 1.

Запрос: огромный величественный ледяной дворец посреди заснеженной пустыни, полярная ночь, северное сияние.

"Шедеврум" 0.5.0
"Шедеврум" 0.5.0
"Кандинский" 2.2
"Кандинский" 2.2

Монументальные постройки в пустынях, часть вторая.

И снова "Кандинский" проявил исключительную сдержанность, которая на этот раз пошла ему не на пользу: эта лавочка сувениров Деда Мороза никак не тянет на величественный дворец, тем более огромный. Такая грубая ошибка перечёркивает даже исключительный фотореализм картинки, поскольку про реализм ничего в запросе сказано не было, а вот про масштабы дворца — было.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Общий результат: "Шедеврум" - 9, "Кандинский" - 7.

Результат по итогам 15 раундов: "Шедеврум" - 123, "Кандинский" - 107.

Резюме таково: "Шедевруму" стоит подтянуть архитектуру, "Кандинскому" — анатомию слонов. Зато качество рендера первого и реалистичность второго по сравнению с предыдущими версиями взлетели до небес. При этом "Шедеврум" продолжает пусть немного, но всё же обгонять "Кандинского" в том, что касается точности интерпретации запроса.

Ну хорошо, подурачились и хватит. Пора расширить круг знакомств и представить вам какую-нибудь новую нейросеть, о которой до сих пор в этом блоге речи не шло. Вот в следующий раз этим и займусь.