Kandinsky — нейросеть от Сбера для создания изображений по запросу пользователей. Функционирует как многие аналоги на базе диффузионной модели, предполагающей размывание картинки с последующим восстановлением и генерацией нового изображения. В отличие от других сервисов хорошо распознает русскоязычные запросы, при этом разработчики говорят о поддержке свыше 100 языков.
Что может нейросеть Kandinsky
Представленная весной 2023 года обновленная версия 2.2 позволяет задавать высоту/ширину картинки, генерировать стикеры и реалистичные фотографии, делать стилизацию с помощью своих набросков, законченных композиций или текстового запроса. Функция «Ластик» позволяет закрасить часть изображения, которую нужно изменить. Есть опция дорисовки сгенерированного или загруженного файла.
Нейросеть способна редактировать существующие картинки, смешивать ряд изображений либо текст с картинками. Итоговый результат предоставляется с разрешением до 1024 пикселей.
Для создания картинки необходимо задать точный и детальный промпт (запрос). На сайте Сбера доступна наиболее простая вводная в формате объект + фон + стиль. Предлагается больше 20 стилей, среди которых: киберпанк, аниме, мультяшный стиль, классицизм, Малевич, Пикассо, мультфильм, Айвазовский, хохлома и др. Возможно добавление стилистики, отсутствующей в этом списке, через текстовый запрос.
Где работать с нейросетью
Kandinsky 2.2 доступен на нескольких платформах:
- официальный сайт Сбера;
- бот ВК;
- семейство голосовых ассистентов Сбера «Салют».
Один из самых удобных вариантов работы с Kandinsky 2.2 — официальный бесплатный Телеграм-бот. Он отличается мгновенной генерацией, безопасен для пользователей и поддерживает основные режимы сервиса.