9,3K подписчиков
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...
2 года назад
670 подписчиков
Распознавание речи это преобразование речи в текст.  Системы распознания речи, позволяют обрабатывать человеческую речь, аудио видео файлы и преобразовывают ее в текстовый формат. Наиболее эффективные алгоритмы, используют при распознавании речи, методы и технологии из областей искусственного интеллекта и машинного обучения. Большинство этих алгоритмов самообучаемы и со временем совершенствуются. Программы использующие распознавания речи нашли широкое применение во многих сферах деятельности, например, голосовые помощники (ассистенты), голосовой ввод сообщений, управление голосом...
1 год назад
3,5K подписчиков
Приветствую тебя мой друг. В прошлой части мы сделали голос для нашего ассистента, в этой части мы сделаем слуховой аппарат. Он нам необходим так как голосовой ассистент должен анализировать нашу речь. Идея голосового ассистента была взята с канала Хауди-Хо. Так как код будет большим - я разобью статью на несколько частей: 1 часть - va_voice 2 часть - micro 3 часть - main Во 2-ой части мы разберем как сделать распознавание нашей речи для голосового ассистента. Установка нужных библиотек: Первым...
2 года назад