Найти тему

Вышла новая версия "Кандинского" - Kandinsky 2.2.
Вот прямо только что обновился его телеграм-бот, ну и на сайтах RuDALL-E и FusionBrain версия тоже, разумеется, поменялась на новую.
Вот что об обновлении пишут разработчики:
🗨
Модель Kandinsky 2.2 позволяет создавать изображения более высокого разрешения — до 1024 пикселей — с различным соотношением сторон, а получающиеся результаты обладают высокой степенью фотореалистичности. Архитектурно Kandinsky 2.2 не отличается от версии 2.1, но за счёт увеличения энкодера изображений для Image prior модели до версии CLIP-g удалось повысить качество генераций. Также в рамках общей архитектуры мы перестали передавать текстовые эмбеддинги в диффузионную модель UNet.
...
😐😑😐😑😐
...
Это на сакральном языке тайного знания, это не для рядовых пользователей. Давайте сделаем умное лицо и просто согласимся с тем фактом, что увеличение энкодера до версии CLIP-g - это хорошо.
Лично для меня хорошо вот что:
1) в телеграм-боте появилась возможность выбирать соотношение сторон: 16:9, 3:2, 1:1, 2:3 или 9:16.
2) обновились режимы генерации. Теперь их больше:
- генерация по тексту;
- смешивание;
- перенос стиля;
- вариации картинки;
- создание стикера (!!!).
Последнее - просто удивительное совпадение, учитывая, что совсем недавно одна из моих публикаций была посвящена именно технике создания стикеров в "Кандинском". А теперь вот никакой техники не нужно, достаточно нажать на кнопку. Удобно? Удобно! Я называю это заботой о клиенте.
Конечно, все новшества перепробую и обо всём подробно расскажу в ближайшее время.

Но самое главное - даже не новые стили и не пропорции картинок.
Самое главное - по запросу "скворечник" Kandinsky 2.2 рисует скворечник! 😂 Нарядный, красочный скворечник. И это прекрасно.
Тем не менее я буду бережно хранить "скворечники", созданные моделью 2.1, как дорогие воспоминания. Такое ведь не повторяется!
(Для тех, кто не в курсе, в чём здесь юмор, я не буду сразу раскрывать карты, а просто дам ссылку на статью "7 вещей, которые не умеет рисовать "Кандинский" (а "Шедеврум" умеет))

Уважаемые разработчики @sber'а!
Это хорошо, что вы починили скворечники в телеграм-боте. Теперь почините, пожалуйста, на ruDALL-E. Там до сих пор по кодовому слову "скворечник" генерируется сера. Теперь - в новой упаковке!
1 минута