Найти тему
Лайфхакер

«Сбер» представил нейросеть Kandinsky. Её можно опробовать в приложении на смартфоне

Это самая большая модель генерации изображений по текстовому описанию на русском языке.

«Сбер» официально представил нейросеть Kandinsky. Это улучшенная версия мультимодальной ruDALL-E, генерирующей картинки по описанию и представленной ещё в прошлом году.

Разработчики отметили, что смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями. Kandinsky умеет генерировать картинки с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения.

Изображение: Sber📷
Изображение: Sber📷

Создание изображений происходит в три этапа:

  • Сначала одна нейросеть (Kandinsky) генерирует заданное число изображений по описанию.
  • Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию работы.
  • А после третья увеличивает картинки в размере.

Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.

Опробовать нейросеть Kandinsky может любой желающий. Она доступна в мобильном приложении «Салют» и на умных устройствах «Сбера» по запросу «Включи художника».

-2

Kandinsky попросит произнести описание, а спустя несколько минут вернётся с девятью вариантами изображений. Останется лишь выбрать одно из них для увеличения размера.

Скачать в googleplay Скачать в appstore Читайте также 🧐