Неделю не могу отлипнуть от создания картинок в нейросетях. И не то чтобы мне эти сети были совсем в новинку, но такого залипательного эффекта раньше не наблюдалось.
Первый мой опыт общения с рисующей сетью имел место года три назад - это был тогда ещё совсем новый проект Сбера Dall-E. Картинки, которые он генерировал, выглядели примерно как нарисованные третьеклассником в Пейнте. Было удивительно, забавно, но желания сохранять эти шедевры для потомков не возникло.
А в прошлом году в мире случился Midjourney, который немедленно поставил на уши художников, художников-любителей и любителей художников. Ко всеобщему разочарованию, жадные (или бедные в смысле вычислительных мощностей) создатели Midjourney сделали его платным, так что поиграть в демо-режиме на сайте проекта было можно, но недолго. Потом просили денег, и приходилось заново регистрироваться под другой личиной другим электронным адресом.
После Midjourney появилось ещё несколько генераторов, причём бесплатных, и дело, похоже, поставили на поток.
И вот на днях вышла бета-версия очередного генератора изображений, на этот раз отечественного, от Яндекса, под названием "Шедеврум". Армия "Толоки", добровольцы которой годами подробно описывали всё, что видят на предложенных картинках, - это было не зря! Благодаря вам, скромные герои, сегодня сотни (тысячи? - на самом деле я понятия не имею, сколько человек уже получили доступ к приложению) школьников круглосуточно и бесплатно генерируют пушистые кубики Рубика, вязаных капибар, котов в разнообразных одёжках и томных дев без оных.
Сбер всё это время тоже не груши околачивал, и вскоре после выхода "Шедеврума" выпустил обновлённую версию своего ИИ, которого теперь зовут "Кандинский" (версия 2.1). У него нет мобильного приложения, зато есть бот в Телеграме, что в некотором отношении даже удобнее.
Такое массированное импортозамещение искусственных интеллектов сломило мою волю. Я не могу не генерировать картинки целыми днями вместе с такими же ИИ-зависимыми, но всё же хочу извлечь из этого занятия что-то ценное. Поэтому - почему бы не сравнить уровень мастерства "Шедеврума" и "Кандинского", и заодно выяснить, что они вообще могут, а что им пока не под силу?
Битва будет неравной, примерно как между студентом и дошколёнком. "Шедеврум" пока существует только в бета-версии 0.1.4, а "Кандинский" - уже опытный матёрый рисовальщик со стажем. Но не следует забывать, что иногда талант проявляется с пелёнок, а чужие нейросети быстро растут.
В моём (продолжающемся) эксперименте каждой нейросети отправляется один и тот же запрос. Буквой "Ш" я обозначаю результат "Шедеврума", буквой "К" - "Кандинского".
Запросы я стараюсь делать разнообразными, но в честь вчерашнего праздника начнём, пожалуй, с подборки картинок про космос.
Поехали!
Запрос: космонавт в невесомости в открытом космосе, на фоне туманности, поздравляет с Днём космонавтики, высокое разрешение, высокая детализация
Формально всё точно. Космонавт - есть, одна штука; открытый космос - есть, невесомость и туманность тоже есть. За шлемом не видно, поздравляет он там или нет, но это подразумевается. У обоих, правда, странные конечности - фирменная фишка молодых нейросетей.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: горизонт событий
Ну, горизонт событий - понятие пока чисто умозрительное, своими глазами его никто не видел (и не увидит, согласно сегодняшним законам физики). Эстетически картинки приятные, поэтому зачтено.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: гиперпространственный прыжок
Сдаётся мне, "Шедеврум" лучше понимает, что имеется в виду под гиперпространственным прыжком, зато "Кандинский" творчески мыслит. В данном случае даже искорёженные конечности можно списать на воздействие разрыва в ткани пространства-времени.
Результат: "Шедевруму" за понятливость -1, "Кандинскому" за креативность - 1.
Запрос: ночное небо и Млечный путь над спокойным океаном, высокое разрешение
Снова всё на месте, разве что у "Шедеврума" вышло немного скучно, а у "Кандинского" на горизонте подозрительно виднеется какая-то суша.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: планета Земля, вид из космоса, ночная сторона, города как светящиеся точки соединены тонкими пунктирными линиями
Картинку, которая была у меня в голове, точно не воспроизвёл никто, но "Шедеврум" старался сильнее и выполнил запрос куда более вменяемо.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: закат на Сатурне, вид с поверхности Сатурна, темно, Солнце маленькое и тусклое, в небе много мелких светящихся точек, высокая детализация, высокое разрешение
Нет, мы, конечно, не были на Сатурне, но диспозиция небесных тел у "Кандинского" идёт вразрез со всем, что знает человечество.
Результат: "Шедеврум" - 1 с натяжкой, "Кандинский" - 0.
Запрос: НЛО над морем испускает луч света, столб из воды поднимается вверх к НЛО, ночь
Честно говоря, мне пришлось повозиться с запросом, чтобы заставить "Шедеврум" изобразить в точности то, что мне было нужно - забор проб воды инопланетными гостями :) Но "Кандинскому" даже этот отточенный запрос не очень помог. Свет вижу, столб воды не вижу. Да и тарелочка кривовата, чего уж там.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: two men, side view, staring angrily at each other, confrontation, sci-fi, glowing lights, spaceship interior
Сцена незадолго до бунта на космическом корабле. Назревают раскол в команде и большие проблемы у командира. Хотелось бы видеть больше напряжения между героями, особенно у "Кандинского", но, так и быть, отдам по баллу каждому.
Результат: "Шедеврум" - 1, "Кандинский" - 1.
Запрос: девочка с плюшевым медведем смотрит на Землю из иллюминатора космического корабля
При всех странностях анатомии первой девочки вторая - просто сшитый из кусков человека и плюшевого медведя монстр Франкенштейна. И сидит она не у иллюминатора, а внутри стеклопакета, похоже. Насчёт Земли тоже не всё однозначно. В общем, неуд.
Результат: "Шедеврум" - 1, "Кандинский" - 0.
Запрос: giant pirate spaceship floating in space, heading to the left, nebula in the background, high detail
И под занавес - космические пираты. "Шедеврум" честно направил корабль влево, как заказано, а "Кандинский" снова проявил художественные вольности и ослушался, зато прифигачил паруса и в целом оформил космический корабль в духе "Летучего голландца" - чтобы, значит, всем сразу было понятно, что это пираты.
Результат: "Шедевруму" за прилежание - 1, "Кандинскому" за креативность - 1.
Общий итог раунда: "Шедеврум" - 10, "Кандинский" - 6.
Не стоит слишком переживать за "Кандинского", всё только начинается и он ещё себя проявит. В следующий раз изучим особенности изображения нейросетями национальных характеров :)