Американская компания OpenAI анонсировала новую нейросеть Voice Engine, которая может по 15-секундному отрывку голоса скопировать его и озвучить написанный текст, стараясь наиболее точно передать речевые особенности и голос говорящего. В компании утверждают, что запретят использовать нейросеть для того, чтобы выдавать себя за другого человека.
OpenAI создала нейросетевую модель Voice Engine для воссоздания человеческого голоса по образцу, сообщает пресс-служба компании.
Для озвучки «клонированным» голосом нейросети достаточно представить аудиопример голоса человека, который нужно воссоздать, длиной 15 секунд.
Разработка модели началась в конце 2022 года. Нейросеть может озвучить текст на английском, французском, испанском, китайском и других языках. Система сохраняет особенности голоса «оригинала», что позволяет генерировать речь на других языках «с акцентом».
Несмотря на широкие возможности Voice Engine, компания OpenAI пока не открывает общественного доступа к данному сервису в целях безопасности.
В то же время OpenAI ведет переговоры с партнерами на тему прозрачности в использовании ИИ-озвучки и защиты от неправильного использования. По словам создателей, они внедрили в систему водяные знаки аудиоданных и другие меры безопасности.