Пока все гонятся за размерами моделей, Alibaba Cloud идет в обратную сторону и побеждает. Состоялся релиз CosyVoice 3 — компактной нейросети для клонирования голоса и озвучки, которая при своих скромных размерах выдает феноменальные результаты. Вот почему это событие обсуждает всё IT-сообщество: 🔖 ⚡️ Работает даже на «калькуляторе» Модель имеет всего 0.5B параметров. Это значит, что её можно запустить локально практически на любом современном ПК или даже ноутбуке. Больше не нужны гигантские серверные мощности для качественного синтеза речи. 🔖 🎙 Клонирование голоса за секунды (Zero-shot) Главная «киллер-фича» — режим Zero-shot. Вам нужно всего от 3 до 10 секунд записи голоса, чтобы нейросеть полностью скопировала его тембр, интонации, эмоции и даже фоновые шумы. При этом качество генерации в 3 раза превосходит аналогичные решения от конкурентов. 🔖 🌍 Поддержка русского языка CosyVoice 3 — по-настоящему мультиязычная модель. Она поддерживает 9 языков, включая русский и английский.
📚 🎙 Революция в клонировании голоса: Alibaba представила CosyVoice 3 — мини-нейронку, которая «порвала» рынок
20 января20 янв
5
1 мин