Найти в Дзене

🚀 Сбер выпустил Kandinsky 5.0

🚀 Сбер выпустил Kandinsky 5.0 Генерация изображений и видео теперь в открытом доступе. 🎬 В семейство вошли две основные модели: Image Lite для создания HD-изображений и Video Pro для генерации пятисекундных видеороликов. Обе модели интегрированы в GigaChat и доступны через веб-сайт, приложение на Android, а также в Telegram и мессенджере Max. Модели обучались на впечатляющем массиве данных: почти 1 млрд изображений и 300 млн видео. Разработчики делали ставку на эстетику и качество, поэтому на финальных этапах обучения использовали датасет "сверхкачественного" контента, отобранного профессиональными дизайнерами и художниками. Kandinsky 5.0 хорошо понимает запросы на русском и английском языках, ориентируется в российском культурном контексте и может создавать надписи на кириллице и латинице. Главная новость — все модели выложены в открытый доступ на GitHub, Hugging Face и GitVerse по лицензии MIT. Это означает, что разработчики могут использовать их даже в коммерческих проекта

🚀 Сбер выпустил Kandinsky 5.0

Генерация изображений и видео теперь в открытом доступе.

🎬 В семейство вошли две основные модели: Image Lite для создания HD-изображений и Video Pro для генерации пятисекундных видеороликов.

Обе модели интегрированы в GigaChat и доступны через веб-сайт, приложение на Android, а также в Telegram и мессенджере Max.

Модели обучались на впечатляющем массиве данных: почти 1 млрд изображений и 300 млн видео.

Разработчики делали ставку на эстетику и качество, поэтому на финальных этапах обучения использовали датасет "сверхкачественного" контента, отобранного профессиональными дизайнерами и художниками.

Kandinsky 5.0 хорошо понимает запросы на русском и английском языках, ориентируется в российском культурном контексте и может создавать надписи на кириллице и латинице.

Главная новость — все модели выложены в открытый доступ на GitHub, Hugging Face и GitVerse по лицензии MIT.

Это означает, что разработчики могут использовать их даже в коммерческих проектах.

Вместе с Kandinsky 5.0 Сбер опубликовал модели GigaChat Ultra Preview, компактную GigaChat Lightning, набор из пяти моделей распознавания речи GigaAM-v3 и автокодировщики K-VAE 1.0.

Модель Video Pro генерирует до 10 секунд HD-видео в 24 fps и, по данным CNews, превосходит конкурента Wan 2.2 A14B.

Доступно в GigaChat.

🚀 VPN bot | канал О техно 🧑‍💻