10,3 тыс подписчиков

🎙 MetaVoice-1B: 1.2B parameter base model trained on 100K hours of speech for #TTS (text-to-speech)

> Новейшая модель высококачественного клонирования голоса .

> 1.2B параметрическая модель.

> Обучена на 100 тысячах часов данных.

> Синтез коротких и длинных разговоров.

> Генерация эмоциональной речи.

> Лицензия Apache 2.0. 🔥

Простая, но надежная архитектура:

> Encodec (Multi-Band Diffusion) и GPT + Encoder Transformer LM.

> DeepFilterNet для очистки от артефактов MBD.

01:54

Около минуты

7 февраля 2024