Найти в Дзене

Сравнение Kandinsky 2.2 и Шедеврум 0.5.0 (генерация изображений из текста)

Оглавление

Сегодня Сбер обновил свой Kandinsky, а Яндекс на днях обновил свою генеративную модельку в Шедевруме. Проверим на что они способны, без лишних слов.

1. как выглядел бы автомобиль Тесла в 1950 году

Шедеврум
Шедеврум

Kandinsky
Kandinsky

Думаю тут победителем вышел Шедеврум, он прекрасно схватил идею дизайна Теслы и сделал её версию из "прошлого" и картинка в целом вышла куда более детальной и красивой.

2. кот киборг сидит за столом, дарк ботаникал, Москва

Шедеврум
Шедеврум

Kandinsky
Kandinsky

Кандинский нарисовал довольно хорошего кота, но не учел моего пожелания, чтобы он был киборгом. Видимо, он посчитал, что металлический ошейник достаточен для этого. Зато кот сидит за столом, как я и просил. У Шедеврума кот выглядит как настоящий киборг, но он не сидит за столом, а на нем. К тому же, стол получился странным: будто он растет из хвоста кота. Я бы выбрал картину Кандинского.

3. миниатюрная модель автомобиля уаз патриот 2020 года черного матового цвета

Шедеврум
Шедеврум

Kandinsky
Kandinsky

Я пытался сделать генерацию в Кандинском несколько раз, но очевидно что он не знает такой машины как УАЗ Патриот и судя по всему улавливает лишь какую-то патриотическую идею. Здесь очевидно победа за Шедеврумом, он прекрасно справился.

4. кота затягивает в чёрную дыру, ему страшно

Шедеврум
Шедеврум

Kandinsky
Kandinsky

У Кандинского кот получился как будто заглядывающий в стиральную машину, это совсем не похоже на чёрную дыру. Шедеврум справился прекрасно, всё что я написал - соблюдено. Коту страшно и он действительно улетает в чёрную дыру. Задание сложное, Шедеврум забирает приз.

5. гном киборг в лесу, акварель

Шедеврум
Шедеврум

Kandinsky
Kandinsky

У Шедеврума получился классный гном и он действительно киборг. Кандинский почему-то нарисовал просто робота, который совсем не похож на гнома, хотя и довольно крутой в целом. Выиграл Шедеврум, потому что нарисовал он именно то, что я хотел.

6. Москва сити, киберпанк, акварель

Шедеврум
Шедеврум

Kandinsky
Kandinsky

Вообще изображение от Кандинского мне нравится больше, оно более детализировано, с интересным настроением, но чёрт возьми - тут совсем нет никакого киберпанка и никакой Москва-сити. Изображение от Шедеврума это именно то, что я хотел, хоть и более смазанное, но ощущение киберпанка здесь точно присутствует.

Выводы:

Я хочу отметить, что модель Кандинского имеет много достоинств: она может генерировать изображения разных форматов (не только квадратные) и имеет много функций в телеграм боте. Но здесь я сравниваю только простую генерацию изображений. Также стоит заметить, что Кандинский делает одно изображение за раз, а Шедеврум - сразу четыре, что дает пользователю больше выбора (и даёт некоторое преимущество Шедевруму при сравнении). Мне показалось, что модель от Шедеврума лучше учитывает мои пожелания и делает именно то, что я хочу. Яндекс сделал большой прогресс, качество изображений стало отличным, раньше Шедеврум был намного хуже предыдущей версии Кандинского. Кандинский же иногда пропускает детали из текста, что является его недостатком.

Шедеврум побеждает в этой битве.