Сбер обновил фирменную нейросеть Kandinsky до версии 2.2. По словам разработчиков, теперь она гораздо лучше справляется с созданием портретов, делает более реалистичные изображения в высоком качестве и даже умеет генерировать стикеры.
Разработчики дообучили нейросеть на наборе данных из 1,5 миллиарда парт «текст-изображение», что на 300 миллионов больше, по сравнению с предшествующей версией. В Kandinsky 2.2 также была добавлена архитектура ControlNet, которая позволяет изменять отдельные элементы на уже созданных картинках. Ещё одной интересной возможностью стала генерация наборов стикеров для Telegram.
Kandinsky 2.2 способна понимать запросы на 101 языке, рисовать более чем в 20 стилях, смешивать несколько картинок и дорисовывать недостающие части изображения. Её созданием занимались сотрудники Sber AI и учёные Института искусственного интеллекта AIRI на датасете Sber AI и SberDevices.
Опробовать новую версию нейросети можно на сайте проекта, на платформах Fusion Brain и ML Space, через ботов в Telegram и во «ВКонтакте», а также с помощью команды «Запусти художника» на умных устройствах Sber и в приложении «Салют».