Добавить в корзинуПозвонить
Найти в Дзене
КББ

Kandinsky 6.0 Image Pro от Сбера

Сбер представил обновление своей модели генерации и редактирования изображений — Kandinsky 6.0 Image Pro. Главные новшества - Усовершенствованное редактирование (editing) Модель теперь справляется с тонкими задачами редактирования, которые обычно вызывают сложности у подобных систем: - органично встраивает правки в сцену; - сохраняет стиль, геометрию, черты лица и фон; - поддерживает локальную консистентность изображения. Side-by-side сравнения с лидерами рынка (Flux 2 Max и GPT Image 1.5) показали высокие результаты Kandinsky 6.0 Image Pro. На графике видно, что модель демонстрирует: - 56/44 в сравнении с Flux 2 Max; - 55/45 — с GPT Image 1.5; - также проведены тесты с Nano Banana Pro (33/67) и другими моделями. - Значительный прирост скорости Kandinsky 6.0 Image Pro работает быстрее предыдущей версии более чем на 40%! Такой результат достигнут благодаря: - архитектуре MoE (Mixture of Experts); - распараллеливанию инференса; - оптимизации механизма внимания. - Инновационный ме

Kandinsky 6.0 Image Pro от Сбера

Сбер представил обновление своей модели генерации и редактирования изображений — Kandinsky 6.0 Image Pro.

Главные новшества

- Усовершенствованное редактирование (editing)

Модель теперь справляется с тонкими задачами редактирования, которые обычно вызывают сложности у подобных систем:

- органично встраивает правки в сцену;

- сохраняет стиль, геометрию, черты лица и фон;

- поддерживает локальную консистентность изображения.

Side-by-side сравнения с лидерами рынка (Flux 2 Max и GPT Image 1.5) показали высокие результаты Kandinsky 6.0 Image Pro. На графике видно, что модель демонстрирует:

- 56/44 в сравнении с Flux 2 Max;

- 55/45 — с GPT Image 1.5;

- также проведены тесты с Nano Banana Pro (33/67) и другими моделями.

- Значительный прирост скорости

Kandinsky 6.0 Image Pro работает быстрее предыдущей версии более чем на 40%! Такой результат достигнут благодаря:

- архитектуре MoE (Mixture of Experts);

- распараллеливанию инференса;

- оптимизации механизма внимания.

- Инновационный механизм Image RAG

Особенность новой модели — встроенный механизм Image RAG (Retrieval-Augmented Generation). Как это работает:

- при запросе пользователя модель ищет релевантные изображения в базе знаний;

- подтягивает найденные изображения в контекст генерации;

- значительно точнее выполняет специфические запросы (включая элементы отечественной культуры).

Практические кейсы использования

- удаление объектов и надписей с сохранением консистентности сцены;

- замена предметов с учётом стиля исходного изображения;

- стилизация фото с сохранением черт лица (например, «перерисуй в стиле рисунка цветными карандашами»);

- реставрация архивных фото (восстановление чёткости, колоризация);

- дизайн интерьеров по плану («фотореалистичный интерьер гостиничной спальни по чертежу»);

- создание фасадов зданий одним промтом («фасады всех зданий в современном стиле из стекла»);

- нейрофотосессии — генерация серии кадров на основе одной фотографии (смена фона, одежды, локации).

Дополнительные возможности

- ретушь, макияж, смена образа;

- наложение фильтров;

- точечное редактирование (изменение причёски, добавление очков без затрагивания других деталей);

- совмещение элементов нескольких изображений в одном.

Где попробовать

Kandinsky 6.0 Image Pro уже доступен на всех площадках GigaChat:

- в Telegram;

- в мессенджере Max;

- на сайте giga.chat;

- в Android-приложении.

В ближайшее время появятся новые функции:

- редактирование по трём референсам;

- детальное редактирование с помощью специальной кисти («добавь сюда подушку и столик»).