Voice Engine – нейросеть для копирования голоса от компании OpenAI. Переводит ролики и аудио на другой язык с сохранением оригинальной интонации и речевых особенностей. Воспроизводит голос человека на основе 15-секундной записи. Как работает нейросеть Нейросеть Voice Engine AI работает на основе ИИ алгоритмов, способных синтезировать любой голос. Искусственный интеллект по короткой аудиозаписи может скопировать и воспроизвести уникальное звучание, эмоциональные оттенки и тембр. Нейросеть подражает речевым особенностям оригинала...
Real-Time Voice Cloning - потрясающий проект. По сути, может «выучить» чей-то голос по 5-секундной записи речи, а затем использовать "выученный" голос, чтобы говорить что угодно. Этот репозиторий представляет собой реализацию алгоритмов машинного обучения для синтеза речи с несколькими говорящими (SV2TTS) с помощью алгоритм, работающего в режиме реального времени. SV2TTS — это среда глубокого обучения, чья работа состоит из трех этапов. На первом этапе создается цифровое представление голоса из нескольких секунд аудио. На втором и третьем этапах это представление используется в качестве эталона для генерации речи на основе произвольного текста...