Найти тему

Битва интеллектов: "Шедеврум" против "Кандинского", раунд 8

"Good omens", "Кандинский 2.1", экран, пиксели, 2023. Фрагмент.
"Good omens", "Кандинский 2.1", экран, пиксели, 2023. Фрагмент.

Вот уже две недели я провожу ленивый эксперимент, скармливая нейросетям одинаковые запросы и сравнивая их результаты. Не надоедает.

Попутно выявляются некоторые интересные подробности. Например, что "Кандинский" в целом любит приглушённые, тёмные оттенки и склонен генерировать слегка депрессивные картинки. Как-то раз он даже букет полевых цветов мне изобразил так, что сразу стало ясно: жизнь - боль, всё сущее - прах и тлен.

"Шедеврум" же, наоборот, позитивен и не жалеет красок. Кроме того, он чаще генерирует (псевдо)фотоизображения, а люди на его портретах чаще улыбаются.

Любопытно, что похожую картину я наблюдаю в музыкальных сервисах Яндекса и Сбера. Когда жизнь заставила отказаться от Spotify, передо мной встал выбор: "Звук" или Яндекс.Музыка. В качестве затравки в оба сервиса отправился уже готовый плейлист Spotify из трёхсот с лишним песен, на основе которого каждый сделал свои выводы.

Надо сказать, что музыкальный вкус у меня довольно эклектичен. Яндекс уловил этот момент сразу и начал прощупывать почву на предмет пограничных стилей. А вот это тебе не понравится? А вот это?

В итоге сегодняшняя "Моя волна" - это такое странное место, где после рокабилли играет дримхаус, после классических кроссоверов - похмельный канадский панк, после музыкальных коллабораций с котами - глумливые индийские каверы на поп-хиты, а после англоязычной джазовой версии колыбельной "Спят усталые игрушки" - немецкий фолк-метал. Короче, самое оно.

"Звук" из того же самого плейлиста сделал очень однобокие выводы, и предлагает мне исключительно тяжёлую музыку - чем злее, тем лучше. В целом-то я не против, под настроение особенно, но для повседневных прогулок по городу предпочитаю всё же Яндекс.

И вот так непринуждённо мой отвлечённый рассказ подвёл нас к теме сегодняшнего баттла.

Сегодня мы с сетями пошатаемся по улицам, поглазеем по сторонам, постоим под цветущей сакурой, заглянем на рынок и покатаемся на троллейбусе. Причём делать всё это мы будем в совершенно разных городах.

Запрос: городская улица, поздний вечер, на переднем плане на стене дома большая неоновая вывеска, освещенная дверь в бар, фонари на заднем плане

-2

Начну с любопытного совпадения. Цветовая гамма, ракурс, даже этажность зданий делают эти картинки похожими настолько, что напрашивается вывод: местами две нейросети обучались на одних и тех же примерах. Впрочем, это совсем неудивительно.

Само собой, оценки они тоже получают идентичные.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: граффити на стене небоскреба, высокая детализация

-3

"Кандинский" изобразил вроде бы и стену, и граффити, только вот из картинки совсем не явствует, что это небоскрёб, а потому к финишу он приходит вторым.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: construction site, the tallest building on Earth, up to the stratosphere

-4

Ну, здесь-то ошибиться невозможно: это точно небоскрёбы. "Шедеврум" воздвиг свой где-то в Штатах и оказался более реалистичен, у "Кандинского" небольшие странности с перспективой, а местом действия явно выбран арабский эмират. Запрос выполнен с усердием, давайте зачётки.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: распродажа на рыбном рынке в Брюгге

-5

У "Шедеврума" время действия - времена оны; рынок очевиден, Брюгге похож, распродажа вполне может быть, только рыбы не вижу.

Непонятная тара на переднем плане - предположим, лодки, но навалена в них какая-то колбаса и обглоданные кости.

"Кандинский" нарисовал рыбов. Красивое. По ценникам непонятно, насколько сбросили цены и сбросили ли вообще, но допустим. Главное - рыбы.

Не сказать, чтоб от картинок захватывало дух, но уровень исполнения сопоставимый, а в отношении сюжета сильно никто и не промахнулся.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: весна в Париже

-6

Довольно редкая ситуация, когда "Кандинский" сгенерировал как-бы-фото, а "Шедеврум" - как-бы-картину, а не наоборот.

Оба единодушно насадили цветущих вишен и воткнули в горизонт Эйфелеву башню, потому что если вы поищете "весну в Париже" в любом поисковике, то именно это вы и найдёте в девяти случаях из десяти. В десятом случае там будут ещё клумбы с тюльпанами.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: современная абстрактная хромированная скульптура на городской площади, солнечный день

-7

"Шедеврум" полирует лучше, зато "Кандинский" яснее понимает, что делает: его конструкция выглядит цельно и осмысленно, в отличие от невразумительных ртутных шариков соперника.

С другой стороны, кто мы такие, чтобы осуждать современную скульптуру.

Тем не менее, я отдаю балл "Кандинскому" - за инженерную жилку.

Результат: "Шедеврум" - 0, "Кандинский" - 1.

Запрос: плохой район, узкий переулок, граффити на стенах, поваленный забор, фото

-8

Вы не находите забавным, что нейросети понимают слова "плохой район"?

В запросе ничего не было про мусор и обвалившуюся штукатурку, а вот же они. Забора, правда, нет, но и без него вышло весьма убедительно.

Спасибо, что обошлось без гопников.

Результат: "Шедеврум" - 1, Кандинский" - 1.

Запрос: остановка, черный троллейбус, метель, ночь

-9

Эту сцену-страшилку предложил мой друг: чёрный троллейбус, который подбирает опоздавших путников со всеми неприятными вытекающими. Метель - дополнительный антураж уже от меня.

"Шедеврум" набросал ещё парочку более заснеженных версий, но троллейбус в них стоял посреди чиста поля и выглядел скучновато.

"Кандинский" с первого выстрела попал в десятку. Настоящая атмосфера детских страшилок, схвачена самая суть. Даже водителя нет - всё как положено. Чистая победа.

Почему у троллейбусов нет рогов, спрашиваете? А это самки.

Результат: "Шедеврум" - 0, "Кандинский" - 1.

Запрос: ночной город, вид из окна небоскрёба, фото, высокое разрешение, высокая детализация

-10

"Шедеврум" проявил обычное прилежание и не забыл добавить то самое окно, из которого вид.

"Кандинский" высоты явно не боится и предлагает из окна высунуться по пояс, чтобы рамы не мешали. Ключевое слово "фото" ему не помогло: картинка не фотореалистична вот прямо совсем, он даже не старался. Зато город традиционно мрачен и смахивает на Готэм-сити до прилёта Бэтмена.

Результат: "Шедеврум" - 1, "Кандинский" за отсутствие фотореализма - 0.

Запрос: гигантские светящиеся белые человеческие фигуры с крыльями возвышаются над городом, ясное небо, 4k, high resolution, high detail

-11

Начали с совпадения, совпадением и закончим.

Такое впечатление, что оба ИИ срисовывали с одного источника, что вызвало у меня некоторые подозрения. Поиск по картинке, разумеется, выдал ворох изображений гигантских ангелов - парочка из них даже на фоне города, - но в точности такого сюжета не нашлось.

"Кандинский" неожиданно приятно удивил. Даже несмотря на практически идентичную композицию, он здесь снова уложил малыша "Шедеврума" на обе лопатки. По состоянию на прямо сейчас это определённо одна из лучших его генераций.

Результат: ""Шедеврум" - 0, "Кандинский" - 1.

Общий результат: "Шедеврум" - 7, "Кандинский" - 8.

Результат по итогам восьми раундов: "Шедеврум" - 70, "Кандинский" - 58.

Впервые за время моего эксперимента "Кандинский" обошёл "Шедеврум", с чем я его и поздравляю. Правда, в общем зачёте ему ещё догонять и догонять, так что расслабляться рано.

Последние в сегодняшней подборке картинки с ангелами наводят меня на следующую тему: продолжу, пожалуй, персонажами сказок, историй и легенд.