Сбер представил первую российскую мультиязычную диффузионную модель для генерации изображений по текстовому описанию с 2 млрд параметров — Kandinsky 2.0 — на международной конференции по искусственному интеллекту (ИИ) Artificial Intelligence Journey. Нейросеть понимает 101 язык и знает, что в Японии национальное блюдо — суши, а в России — щи. Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке ученых из Института искусственного интеллекта AIRI. Для обучения использовался 1 млрд пар «текст-изображение». Увидеть, как нейросеть рисует, можно уже сейчас на открытом портале FusionBrain.ai, а также на умных устройствах Сбера. В Kandinsky 2.0 используется диффузионный подход, который позволяет синтезировать по текстовому описанию изображения, видео, 3D- и аудиоконтент. Модель может обрабатывать запросы на 101 языке, среди которых не только широко распространенные русский и английский, но и более редкие — например, монгольский. Причем в одном запросе можно использов
Сбер научил нейросеть рисовать изображения по текстовому описанию на 101 языке: посмотрите, как они выглядят
24 ноября 202224 ноя 2022
49
1 мин