CH3. Разъяснения
CosyVoice 3 — это новейшая версия продвинутой системы синтеза речи (TTS) от команды FunAudioLLM (Alibaba).
Если Rowboat — это «память», то CosyVoice 3 — это «голос» искусственного интеллекта. Вот подробный разбор того, что умеет эта система: 1. Zero-Shot клонирование голоса Главная фишка системы. Ей достаточно всего 3-10 секунд записи вашего голоса, чтобы научиться имитировать его. - Вам не нужно обучать модель часами. - ИИ копирует не только тембр, но и манеру речи, интонации и даже дефекты или особенности произношения. 2. Мультиязычность и Cross-lingual синтез CosyVoice 3 поддерживает 9 основных языков...