Найти тему
СберПро

Как «поумнела» нейросеть Kandinsky и чем версия 2.2 отличается от 2.0?

Мы решили проверить на практике.

Kandinsky 2.2 умеет генерировать визуалы по текстовому запросу в более 20 стилях, смешивать несколько картинок и изображения и текст, делать вариации уже готовых изображений. Это открывает массу возможностей для креаторов и бизнеса (об этом мы рассказывали здесь).

А что если не просто протестировать новые функции, а сравнить версию 2.0 с 2.2?

Промты

По словам разработчиков, «кот» —  в топе самых распространённых запросов к нейросети. Поэтому мы тоже начали с него, а затем перешли к более «серьёзным» сюжетам.

Обеим моделям давали одинаковые промты. Результаты — в карточках.

-2
-3
-4
-5

Выводы

  • Нейросеть хорошо распознаёт разные стили (поп-арт, high quality art, ретроаниме и т. д.).
  • Изображения, полученные в новой версии модели, оказывались чётче и контрастнее.
  • Kandinsky 2.2  рисует больше деталей (см. фон изображения с котом).
  • А бизнесовый сюжет в целом оказался сложнее и интереснее (нейросеть точно «поумнела»).
  • Будем тестировать ещё!

Присоединяйтесь к нашим экспериментам. Опробовать нейросеть Kandinsky 2.2 можно в Telegram-боте, на промостранице модели, на платформе FusionBrain.AI и боте соцсети «ВКонтакте», а также при помощи команды «Запусти художника» на умных устройствах Sber, в мобильном приложении Салют.

Читайте ещё по теме

#Технологии #Искусственныйинтеллект #Kandinsky