- Voice Design позволяет запромптить желаемый голос; - Custom Voice идёт с 9 готовыми голосами для китайского, английского, корейского и японского. - А также базовые веса модели для клонирования голосов и как основу для файнтюна. Поддерживает 10 языков, в т.ч. русский; - Задержка — всего 97 мс. Раньше модели были в закрытых API, а теперь доступны на GitHub и HuggingFace. Также есть демка. 👋 Lama AI — #лама_сервисы
✴️ Qwen3-TTS выложили в опенсорс — нейронку для генерации и клонирования речи теперь можно запустить локально
ВчераВчера
~1 мин