Xiaomi открыла код OmniVoice и создала TTS с клонированием голоса и 100 языками

Возвращаем к оригиналу....
В тестах на 24 языках модель обошла несколько коммерческих аналогов по показателям разборчивости и сходства голоса, используя только открытые наборы данных.Актуальные Новости
Во-первых, при обучении модели применили «метод случайного скрытия акустических кодов», что увеличило эффективность обучения и расширило общие возможности модели.3DNews
OmniVoice также включает прикладные функции.Актуальные Новости
Например, можно создавать кастомные голоса, описывая характеристики (возраст, пол, высоту тона, акцент, диалект, стиль речи), а также получать специальные манеры звучания вроде шепота даже без предоставления эталонного аудиосэмпла.NaAvtotrasse.ru
Источники:
Добавить в корзинуПозвонить