Уникальный гадкий утёнок превратился в мейнстримного прекрасного лебедя
Вчера графическая нейросеть "Шедеврум" совершила какой-то невероятный скачок в развитии, сравнимый с превращением гусеницы в бабочку. Причём скакнула она даже раньше, чем успела сказать "гоп!": никаких торжественных объявлений разработчики ещё не делали, номер версии по-прежнему обозначался как 0.2.0, но кое-что радикально поменялось.
Звоночек... да что звоночек - мощная сигнализация зазвенела для меня со всей дури в момент, когда "Шедеврум" впервые в своей жизни выдал в ответ на запрос комплект однотипных результатов:
Но эта нейросеть раньше так никогда не делала. Это и было её фишкой: генерировать четыре абсолютно разные концепции картинок, непохожие по технике исполнения, цветовой гамме и сюжету. Тем она и отличалась от других нейросетей.
Теперь уже не отличается?
По этому же запросу "Кандинский" создал вот что:
А как мы помним, "Кандинский" удивительно похож на Leonardo AI, который, вполне вероятно, удивительно похож на Midjourney (никак руки не дойдут проверить), и все они основаны на базовой модели Stable Diffusion.
Для полноты картины добавлю оленьи головы от Leonardo.
"Да ну, не может быть!" - думаю я и прошу "Шедеврум" нарисовать мне наклейку с драконом в розах. Тот самый сюжет, который использовался для объяснения приёма создания принтов и стикеров в "Кандинском" и Leonardo меньше недели назад. "Шедеврум" тогда в обзор не попал, потому что создавать стикеры пять дней назад он просто не умел. После нескольких безуспешных попыток создать наклейку лучшее, что у него тогда получилось, выглядело так:
Четыре совершенно разных варианта визуализации одного и того же сюжета, из которых под определение наклейки с натягом попадает только картинка слева вверху, но я не могу себе представить, чтобы кто-то захотел это куда-то приклеить.
А вчера "Шедеврум" сказал: "Да легко!" и выдал стикеры в ассортименте:
Превьюшка внизу слева вызвала у меня ещё более мощное дежавю. Для подтверждения догадки дракон в розах был сгенерирован уже без модификатора "стикер":
А вот что по этому поводу думает, к примеру, Leonardo:
Если до сих пор ещё непонятно, к чему я клоню, то вот вам контрольный: в роли лакмусовой бумажки выступает "серебристый инопланетный корабль в поле голубых цветов". Именно эта картинка впервые навела меня на мысль о том, что отечественные разработки могут быть не на сто процентов отечественными. Если вы не читали (или читали, но уже не помните) ту мою публикацию, то я коротенько напомню. По запросу silvery alien spaceship stands in a filed of blue flowers under the clear blue sky on a sunny day, forest in the background (cеребристый инопланетный корабль стоит в поле синих цветов под чистым голубым небом в солнечный день, лес на заднем плане) "Кандинский" выдал вот такие результаты:
Leonardo AI - вот такие:
А вот свежие результаты генерации перерождённого "Шедеврума":
Для сравнения - раньше это выглядело вот так (увы, скриншот с превьюшками не сохранился, но остальные три варианта отличались и от этого, и от вариантов Леонардо-Кандинского):
В общем, картина ясна. Со вчерашнего дня малыш "Шедеврум" примкнул к движению Stable Diffusion/Midjourney, как и многие до него.
Почему разработчики решили сделать такой финт ушами?
Вариантов может быть масса. Меня там не было, и я не специалист, чтобы судить. На мой профанский взгляд, причины резкой смены курса теоретически могут быть, например, такими:
- близится запланированная дата официального релиза, а приложение всё ещё "сырое" - надо было принимать экстренные меры;
- разработчики устали читать о себе насмешливые и издевательские отзывы в интернете, сломались и выбрали проверенный и безопасный путь - а что, все так делают!;
- "Яндекс" искренне хотел создать свою уникальную модель, но работа зашла в тупик, из которого не было выхода, а нейросеть уже вовсю продвигается, поэтому бросать её было нельзя;
- (маленькая теория заговора) "Яндекс" задумал весь этот перформанс с самого начала, и пока программисты допиливали основную версию нейросетевой модели, народу для развлечения дали заведомо нежизнеспособную, чтобы потом поразить в самое сердце волшебным превращением.
Ну что ж, удалось.
Нравится ли мне качество новых генераций "Шедеврума"? Однозначно да.
Нравится ли мне то, что произошло с "Шедеврумом"? Тут ответ сложнее: это смешанное чувство восхищения и разочарования. Мне импонировали разнообразие, креативность и многоплановость старой модели. Да, она не очень хорошо справлялась с построением, но её генерации отличались, скажем так, широтой взглядов, и в этом смысле были уникальны. Теперь же, хоть изображения "Шедеврума" в деталях и отличаются от других нейросетей, но по сюжетной и композиционной сути получаем плюс-минус одно и то же, куда ни обратись с запросом: к "Кандинскому", к "Леонардо" или вот теперь к "Шедевруму".
Я буду скучать по нелепым кривоватым созданиям старого "Шедеврума", но с интересом принимаю новый. Уже сейчас видно, что на закваске Stable Diffusion (с возможным влиянием Midjourney) программисты "Яндекса" намешали много чего своего, и даже эта бета-версия - а это всё ещё бета! - лихо обходит на повороте более старшего и опытного "Кандинского". Моё любимое развлечение - "Битва интеллектов" - с этого момента принимает неожиданный оборот.
Вчера к позднему вечеру в приложении всё-таки обновился номер версии и появилось объявление от разработчиков: мол, представляем вам новую модель, с ней всё станет во много раз прекраснее. Хотите убедиться - попробуйте на ней свои старые запросы и сравните!
Именно этому занятию и был посвящён остаток дня с момента сделанного мной открытия. Результатами сравнения поделюсь с вами в ближайшее время, а пока вот всего пара картинок в рубрике "было - стало".
Запрос: small ornate glass bottle with iridescent liquid, sparkling, a cloud of purple fumes, mysterious, dark background, soft light from behind, aesthetic, realistic, high resolution (маленькая украшенная орнаментом стеклянная бутылочка с радужной жидкостью, сверкающая, облако пурпурного пара, загадочная, тёмный фон, мягкий свет сзади, эстетично, реалистично, высокое разрешение).
"Шедеврум" умер - да здравствует "Шедеврум"!