Если Rowboat — это «память», то CosyVoice 3 — это «голос» искусственного интеллекта. Вот подробный разбор того, что умеет эта система: 1. Zero-Shot клонирование голоса Главная фишка системы. Ей достаточно всего 3-10 секунд записи вашего голоса, чтобы научиться имитировать его. - Вам не нужно обучать модель часами. - ИИ копирует не только тембр, но и манеру речи, интонации и даже дефекты или особенности произношения. 2. Мультиязычность и Cross-lingual синтез CosyVoice 3 поддерживает 9 основных языков (включая русский, английский, китайский, японский, корейский, немецкий, испанский и французский). Смена языка: Вы можете «заставить» голос, записанный на русском, идеально говорить на японском или английском, сохраняя при этом идентичность исходного голоса. Диалекты: Система поддерживает более 18 китайских диалектов, что демонстрирует её глубокую работу с акцентами. 3. Эмоциональный контроль (Instruct Mode) В отличие от «роботизированных» голосов, CosyVoice 3 понимает текстовые инструкции.
CosyVoice 3 — это новейшая версия продвинутой системы синтеза речи (TTS) от команды FunAudioLLM (Alibaba).
13 мая13 мая
1 мин