Американская компания OpenAI анонсировала новую нейросеть Voice Engine, которая может по 15-секундному отрывку голоса скопировать его и озвучить написанный текст, стараясь наиболее точно передать речевые особенности и голос говорящего. В компании утверждают, что запретят использовать нейросеть для того, чтобы выдавать себя за другого человека. OpenAI создала нейросетевую модель Voice Engine для воссоздания человеческого голоса по образцу, сообщает пресс-служба компании. Для озвучки «клонированным» голосом нейросети достаточно представить аудиопример голоса человека, который нужно воссоздать, длиной 15 секунд. Разработка модели началась в конце 2022 года. Нейросеть может озвучить текст на английском, французском, испанском, китайском и других языках. Система сохраняет особенности голоса «оригинала», что позволяет генерировать речь на других языках «с акцентом». Несмотря на широкие возможности Voice Engine, компания OpenAI пока не открывает общественного доступа к данному сервису в целях
OpenAI представила нейросеть Voice Engine для озвучки текстов с человеческим голосом
2 апреля 20242 апр 2024
17
1 мин