590 читали · 3 года назад
🔥 Полезные библиотеки Python. Копируем голос с Real-Time Voice Cloning.
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...
741 читали · 2 года назад
Синтез речи с помощью Python
Раннее в статье мы писали о распознавании речи с помощью Python. Программы использующие распознавания речи нашли широкое применение во многих сферах деятельности, например, голосовые помощники (ассистенты), голосовой ввод сообщений, управление голосом. В данной статье мы рассмотрим другой аспект этого вопроса, а именно синтез речи, т.е. преобразования текста в речь. Программы преобразования текста в речь, также имеют широкое применение, например, голосовые помощники, озвучка меню, озвучка книг и др...