791 подписчик
Слова играют важную роль в выражении наших мыслей. Однако то, что мы не говорим, может быть еще более значимым для передачи эмоций. Человек часто может понять, что люди вокруг него чувствуют, исходя из невербальных сигналов, заложенных в наш голос. Теперь исследователи из Германии попытались выяснить, могут ли технические инструменты точно предсказывать эмоциональные оттенки в фрагментах голосовых записей. Для этого они сравнили точность трех моделей машинного обучения в распознавании различных эмоций в аудиозаписях...
2 месяца назад
9,3K подписчиков
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...
2 года назад