Найти в Дзене
окей, гпт

Kandinsky 2.2 - ребенок Сбера стал умнее и способнее! ч.1

Пока я готовила для вас викторину с нейросетями, увлеченная делом, не заметила, что российская генеративная сеть Kandinsky выросла от версии 2.1 до 2.2! На конференции по нейросетям представитель Сбера говорил, что теперь они составят конкуренцию Midjourney. Проверим? Ну что же, если верить примерам на главной странице, то они и правда стали намного круче, но так ли это на самом деле? Мне и самой очень интересно, так как проверять все гипотезы я буду параллельно с написанием этой статьи. На главной странице разработчики сразу сделали интерактивную стартовую инструкцию для всех начинающих котиков, что очень ценно. На самом деле, можно сказать, что Кандинский - это самая дружелюбная нейросеть для российского пользователя. Сбер и Кандинский получают мой лайк как минимум за то, что делают эксперименты с нейросетями и генерацией изображений доступными даже для самых неискушенных пользователей. Интерфейс программы Тут все предельно просто. Подробнее про использование всех функций Кандинс
Оглавление

Пока я готовила для вас викторину с нейросетями, увлеченная делом, не заметила, что российская генеративная сеть Kandinsky выросла от версии 2.1 до 2.2! На конференции по нейросетям представитель Сбера говорил, что теперь они составят конкуренцию Midjourney. Проверим?

Ну что же, если верить примерам на главной странице, то они и правда стали намного круче, но так ли это на самом деле? Мне и самой очень интересно, так как проверять все гипотезы я буду параллельно с написанием этой статьи.

На главной странице разработчики сразу сделали интерактивную стартовую инструкцию для всех начинающих котиков, что очень ценно.

На самом деле, можно сказать, что Кандинский - это самая дружелюбная нейросеть для российского пользователя.

  1. На данный момент она полностью бесплатна.
    Но все изображения, сгенерированные сетью, остаются собственностью Сбербанка.
  2. Запросы можно писать на русском языке.
  3. Есть сайт, ТГ-бот и VK-бот для генерации.
    А еще Android приложение Салют, и даже на приставке Салют ТВ и то работает.
  4. Есть русскоязычное сообщество VK для общения и обмена картиночками.
Сбер и Кандинский получают мой лайк как минимум за то, что делают эксперименты с нейросетями и генерацией изображений доступными даже для самых неискушенных пользователей.

Интерфейс программы

Тут все предельно просто. Подробнее про использование всех функций Кандинского напишу отдельную статью.

Ваша рабочая зона
Ваша рабочая зона

Есть нововведение - возможность менять формат изображения. Версия 2.1 на сайте Fusion Brain поддерживала только стабильные и гармоничные квадраты. Выбор соотношений сторон всё еще ограничен, а поменять значение пикселей и вовсе невозможно.

На другом сайте, который дает нам доступ к Кандинскому, выбор разрешений немного разнообразнее, но сильно это сути не меняет. На нём же в первой версии можно генерить не только квадраты.

Я, кстати, понятия не имею почему у них два сайта. Здесь интерфейс заметно скуднее и не такой удобный.
Я, кстати, понятия не имею почему у них два сайта. Здесь интерфейс заметно скуднее и не такой удобный.

А что же по качеству?

2.1 vs 2.2 - что изменилось?

Не будем щадить нейросеть и подберем для нее самые изощренные запросы. Первая картинка в карусели - генерация в 2.1, вторая - в 2.2.

Начнём с просто красивых картиночек:

женщина в полный рост под водой, вокруг светящиеся медузы (стиль: студийное фото)

запрос на женские руки с кольцами, фото вблизи провалили все, но вторая версия определенно старалась

портрет красивой бурятской женщины в тюркском наряде (стиль: Портретное фото)

А теперь давайте сделаем что-то более применимое в работе:

главная страница сайта по продаже элитной недвижимости

а это промпт для миджорни, взятый из интернетов и вот тут новая версия Кандинского вызвала вопросики: UI Design of a Real Estate Agency, Landing page, Modern, Classy, Minimalistic, Trending Blue Color Palette on Dribble, High Resolution

дела с продуктовыми фото тоже оказались непростыми, пробовала несколько разных промптов, чтобы получить то, что хочу, остановилась на двух, различающихся только первым словом: продуктовая (коммерческая) фотография наушников для журнала, вокруг розовые цветы, мягкий свет, мягкий контраст

ну что же, завершим это сравнение генерацией логотипа: логотип салона красоты "Луна", 2d, гравюра (без стиля и Рисунок карандашом)

Не буду браться и оценивать эти логотипные генерации - всё вышло красиво, но по-разному. Тем не менее, к современному логотипу, еще и 2d, последний вариант имеет наибольшее отношение.

Выводы

Новая версия Кандинского действительно хороша в генерации лиц и людей. Уверена, что она превосходит первую версию во многих других запросах, которые я не рассмотрела здесь. Оставлю это для ваших экспериментов.

Тем не менее, продуктовое фото, на мой вкус, далось версии 2.1 намного лучше, да и перетаскивание англоязычного запроса для миджорни, так же было воспринято ей на ура, чего не скажешь про её новоявленную сестру.

Ребятам из Сбера еще есть над чем поработать!

А что же насчет обещания о том, что новая версия Кандинского догонит Миджорни? Сравним их в следующей статье!