Вот уже почти два месяца нейросети от Сбера и Яндекса не сходились в творческом поединке на полях моего блога. За это время обе они успели совершить, скажем так, эволюционный скачок, и нонеча они — не то что давеча. "Шедеврум" всё ещё на стадии бета-версии, но уже 0.5.0, а не 0.2.0, а "Кандинский" вырос на один пункт с версии 2.1 до 2.2.
В этой связи интересно же посмотреть, кто дальше скакнул.
Напомню, в чём заключается суть этого моего развлечения. Я выдаю обеим нейросетям один и тот же запрос и смотрю, которая из них лучше справится. Оцениваю в первую очередь адекватность исполнения, то есть соответствие картинки моему описанию, а потом уже эстетическую сторону и фантазию ИИ. Оценки просты до примитивности — либо 0, если результат совсем уж неприемлем или меркнет на фоне конкурента, либо 1, если запрос выполнен удовлетворительно. Всё.
Этот конкурс может идти до бесконечности при условии, что оба участника и я будем в добром здравии. Поэтому время от времени, когда мне хочется проветрить голову, я к нему возвращаюсь. После предыдущих четырнадцати раундов лидирует молодость: 114 баллов у "Шедеврума" против 100 у "Кандинского". Весь баттл в хронологическом порядке собран у меня в одной подборке. Если хотите, можете полюбоваться на трогательные потуги юных нейросетей.
А теперь перейдём собственно к действу. В этот раз не будет ничего тематического, возьму несколько сюжетов в разных жанрах и художественных техниках. Дайджест, так сказать.
Запрос: бревенчатый домик у спокойного озера на опушке соснового леса, большие камни лежат у самой воды, раннее утро, туман.
Эта сцена родилась из моих личных потаённых желаний бросить всё и скрыться в глуши. И в общем-то, обе глуши выглядят для меня одинаково привлекательно. У "Шедеврума" чуть сильнее заметны мелкие погрешности в архитектуре и ствол у сосны слева стёсан рубанком, зато дом с мансардой и верандой, и есть удобный спуск к воде. Да, я там уже мысленно живу.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: портрет лабрадора, набросок углем.
Для наброска углем на обеих картинках слишком много мелких деталей, хотя я не исключаю, что где-то есть таланты (человеческие), которые и так тоже умеют. Закрою глаза на странную анатомию пасти у собаки "Кандинского" — будто губы в паре мест подхватили нитками, чтобы не болтались. Мало ли что там слиплось! В остальном портрет хорош.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: качели на солнечной лужайке, импрессионизм.
А вот и новоприобретённая болезнь "Кандинского" 2.2: непрошеная насыщенность цвета, в народе "вырвиглаз". Правда, в этом конкретном случае к нему придраться сложно, поскольку на самом деле существуют художники, пишущие в такой манере и использующие такую палитру (и кто-то даже покупает их картины задорого). Проще придраться к креплению качелей, но его запороли оба. Поэтому снова победила дружба.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: слон на самокате едет по дороге вдоль цветущих кустов, 2D иллюстрация.
"Кандинскому" было даровано три попытки нарисовать нормального слона, но он упорствовал: левый бивень у всех слонов превращался в недоразвитый второй хобот, задние ноги переезжали вперёд, а круп покоился на сидении скутера — который вообще не самокат, кстати. Трудности перевода: и то, и другое по-английски — scooter. Но, поскольку с самокатом ошиблись оба, его как фактор оценки я вычёркиваю, а вот на анатомию бедного слона закрыть глаза уже не могу. И хотя с бивнями у "Шедеврума" тоже проблемы, его слон хотя бы сможет ходить.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: живописный портрет знатной дамы начала XVIII века.
Судя по оттенку носов, у обеих дам аллергия на позирование, краски и художников в целом. Но если у юной прелестницы "Шедеврума" максимум насморк, то даме "Кандинского" требуется срочная медицинская консультация, примочки и крем SPF 100. Здесь есть доктор?
Это один из тех (нередких) случаев, когда выкрученные на максимум настройки насыщенности "Кандинского" 2.2 совсем не к месту и портят всё впечатление. И всё же картинка соответствует запросу, грубых ошибок нет, так что плюс один балл.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: портрет китайского разведчика в отставке.
Китайского разведчика мне навеяло недавно купленной книгой "Расшифровка" китайского же разведчика в отставке по имени Май Цзя. Книга пока лежит нечитана, так что сказать про неё ничего конкретного не могу. Что же касается портретов, то здесь у нейросетей неожиданно вскрылось глубокое знание предмета. Лично у меня о китайских разведчиках до этого момента было нулевое представление.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: ломтик лимона в воде с пузырьками, крупный план.
В запросе ничего не говорилось о том, что лимон должен быть свежим, поэтому "Кандинский" для начала тщательно высушил свой ломтик, а потом уже залил его газировкой. Не могу сказать, что выглядит аппетитно, но формально условия запроса соблюдены. С некоторой брезгливостью присуждаю ему балл.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: божья коровка сидит на ягоде земляники, крупный план, высокая детализация, мягкое освещение.
Внезапно!..
А знали ли вы, что существуют коровы, дающие фруктовый йогурт? Чтобы их поймать и подоить, нужно выйти в помидорно-клюквенное поле в полнолуние, выложить посередине в качестве приманки гигантскую клубничину, затаиться и ждать.
Мне нравится эта версия, но "Кандинский" получит за неё максимум бурные аплодисменты.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: большой архитектурный фонтан посреди пустыни.
Если подобное где-то и могло бы существовать, то, наверное, только в Эмиратах: там любят вбухивать деньги в странные проекты. Фонтан "Шедеврума" органично вписался бы в дубайский пригород, после чего всю бригаду строителей отправили бы под суд (или куда похуже) за редкую халтуру. Симметрия?.. Не слышали.
"Кандинский" поставил на классику и не прогадал. Элегантность и простота — беспроигрышный вариант.
Результат: "Шедеврум" - 0, "Кандинский" - 1.
Запрос: огромный величественный ледяной дворец посреди заснеженной пустыни, полярная ночь, северное сияние.
Монументальные постройки в пустынях, часть вторая.
И снова "Кандинский" проявил исключительную сдержанность, которая на этот раз пошла ему не на пользу: эта лавочка сувениров Деда Мороза никак не тянет на величественный дворец, тем более огромный. Такая грубая ошибка перечёркивает даже исключительный фотореализм картинки, поскольку про реализм ничего в запросе сказано не было, а вот про масштабы дворца — было.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Общий результат: "Шедеврум" - 9, "Кандинский" - 7.
Результат по итогам 15 раундов: "Шедеврум" - 123, "Кандинский" - 107.
Резюме таково: "Шедевруму" стоит подтянуть архитектуру, "Кандинскому" — анатомию слонов. Зато качество рендера первого и реалистичность второго по сравнению с предыдущими версиями взлетели до небес. При этом "Шедеврум" продолжает пусть немного, но всё же обгонять "Кандинского" в том, что касается точности интерпретации запроса.
Ну хорошо, подурачились и хватит. Пора расширить круг знакомств и представить вам какую-нибудь новую нейросеть, о которой до сих пор в этом блоге речи не шло. Вот в следующий раз этим и займусь.