Найти в Дзене

Битва интеллектов: "Шедеврум" против "Кандинского", раунд 1

Кадр из неснятого фильма "Кротовая нора", "Шедеврум", пиксели, монитор, 2023 год, фрагмент.
Кадр из неснятого фильма "Кротовая нора", "Шедеврум", пиксели, монитор, 2023 год, фрагмент.

Неделю не могу отлипнуть от создания картинок в нейросетях. И не то чтобы мне эти сети были совсем в новинку, но такого залипательного эффекта раньше не наблюдалось.

Первый мой опыт общения с рисующей сетью имел место года три назад - это был тогда ещё совсем новый проект Сбера Dall-E. Картинки, которые он генерировал, выглядели примерно как нарисованные третьеклассником в Пейнте. Было удивительно, забавно, но желания сохранять эти шедевры для потомков не возникло.

А в прошлом году в мире случился Midjourney, который немедленно поставил на уши художников, художников-любителей и любителей художников. Ко всеобщему разочарованию, жадные (или бедные в смысле вычислительных мощностей) создатели Midjourney сделали его платным, так что поиграть в демо-режиме на сайте проекта было можно, но недолго. Потом просили денег, и приходилось заново регистрироваться под другой личиной другим электронным адресом.

После Midjourney появилось ещё несколько генераторов, причём бесплатных, и дело, похоже, поставили на поток.

И вот на днях вышла бета-версия очередного генератора изображений, на этот раз отечественного, от Яндекса, под названием "Шедеврум". Армия "Толоки", добровольцы которой годами подробно описывали всё, что видят на предложенных картинках, - это было не зря! Благодаря вам, скромные герои, сегодня сотни (тысячи? - на самом деле я понятия не имею, сколько человек уже получили доступ к приложению) школьников круглосуточно и бесплатно генерируют пушистые кубики Рубика, вязаных капибар, котов в разнообразных одёжках и томных дев без оных.

Сбер всё это время тоже не груши околачивал, и вскоре после выхода "Шедеврума" выпустил обновлённую версию своего ИИ, которого теперь зовут "Кандинский" (версия 2.1). У него нет мобильного приложения, зато есть бот в Телеграме, что в некотором отношении даже удобнее.

Такое массированное импортозамещение искусственных интеллектов сломило мою волю. Я не могу не генерировать картинки целыми днями вместе с такими же ИИ-зависимыми, но всё же хочу извлечь из этого занятия что-то ценное. Поэтому - почему бы не сравнить уровень мастерства "Шедеврума" и "Кандинского", и заодно выяснить, что они вообще могут, а что им пока не под силу?

Битва будет неравной, примерно как между студентом и дошколёнком. "Шедеврум" пока существует только в бета-версии 0.1.4, а "Кандинский" - уже опытный матёрый рисовальщик со стажем. Но не следует забывать, что иногда талант проявляется с пелёнок, а чужие нейросети быстро растут.

В моём (продолжающемся) эксперименте каждой нейросети отправляется один и тот же запрос. Буквой "Ш" я обозначаю результат "Шедеврума", буквой "К" - "Кандинского".

Запросы я стараюсь делать разнообразными, но в честь вчерашнего праздника начнём, пожалуй, с подборки картинок про космос.

Поехали!

Запрос: космонавт в невесомости в открытом космосе, на фоне туманности, поздравляет с Днём космонавтики, высокое разрешение, высокая детализация

-2

Формально всё точно. Космонавт - есть, одна штука; открытый космос - есть, невесомость и туманность тоже есть. За шлемом не видно, поздравляет он там или нет, но это подразумевается. У обоих, правда, странные конечности - фирменная фишка молодых нейросетей.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: горизонт событий

-3

Ну, горизонт событий - понятие пока чисто умозрительное, своими глазами его никто не видел (и не увидит, согласно сегодняшним законам физики). Эстетически картинки приятные, поэтому зачтено.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: гиперпространственный прыжок

-4

Сдаётся мне, "Шедеврум" лучше понимает, что имеется в виду под гиперпространственным прыжком, зато "Кандинский" творчески мыслит. В данном случае даже искорёженные конечности можно списать на воздействие разрыва в ткани пространства-времени.

Результат: "Шедевруму" за понятливость -1, "Кандинскому" за креативность - 1.

Запрос: ночное небо и Млечный путь над спокойным океаном, высокое разрешение

-5

Снова всё на месте, разве что у "Шедеврума" вышло немного скучно, а у "Кандинского" на горизонте подозрительно виднеется какая-то суша.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: планета Земля, вид из космоса, ночная сторона, города как светящиеся точки соединены тонкими пунктирными линиями

-6

Картинку, которая была у меня в голове, точно не воспроизвёл никто, но "Шедеврум" старался сильнее и выполнил запрос куда более вменяемо.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: закат на Сатурне, вид с поверхности Сатурна, темно, Солнце маленькое и тусклое, в небе много мелких светящихся точек, высокая детализация, высокое разрешение

-7

Нет, мы, конечно, не были на Сатурне, но диспозиция небесных тел у "Кандинского" идёт вразрез со всем, что знает человечество.

Результат: "Шедеврум" - 1 с натяжкой, "Кандинский" - 0.

Запрос: НЛО над морем испускает луч света, столб из воды поднимается вверх к НЛО, ночь

-8

Честно говоря, мне пришлось повозиться с запросом, чтобы заставить "Шедеврум" изобразить в точности то, что мне было нужно - забор проб воды инопланетными гостями :) Но "Кандинскому" даже этот отточенный запрос не очень помог. Свет вижу, столб воды не вижу. Да и тарелочка кривовата, чего уж там.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: two men, side view, staring angrily at each other, confrontation, sci-fi, glowing lights, spaceship interior

-9

Сцена незадолго до бунта на космическом корабле. Назревают раскол в команде и большие проблемы у командира. Хотелось бы видеть больше напряжения между героями, особенно у "Кандинского", но, так и быть, отдам по баллу каждому.

Результат: "Шедеврум" - 1, "Кандинский" - 1.

Запрос: девочка с плюшевым медведем смотрит на Землю из иллюминатора космического корабля

-10

При всех странностях анатомии первой девочки вторая - просто сшитый из кусков человека и плюшевого медведя монстр Франкенштейна. И сидит она не у иллюминатора, а внутри стеклопакета, похоже. Насчёт Земли тоже не всё однозначно. В общем, неуд.

Результат: "Шедеврум" - 1, "Кандинский" - 0.

Запрос: giant pirate spaceship floating in space, heading to the left, nebula in the background, high detail

-11

И под занавес - космические пираты. "Шедеврум" честно направил корабль влево, как заказано, а "Кандинский" снова проявил художественные вольности и ослушался, зато прифигачил паруса и в целом оформил космический корабль в духе "Летучего голландца" - чтобы, значит, всем сразу было понятно, что это пираты.

Результат: "Шедевруму" за прилежание - 1, "Кандинскому" за креативность - 1.

Общий итог раунда: "Шедеврум" - 10, "Кандинский" - 6.

Не стоит слишком переживать за "Кандинского", всё только начинается и он ещё себя проявит. В следующий раз изучим особенности изображения нейросетями национальных характеров :)