9,3K подписчиков
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...