863,1 тыс подписчиков

OpenAI представила нейросеть для копирования голоса человека

1 апреля 20241 апр 2024

1 мин

Компания OpenAI представила нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера. Разработка позволит озвучить текст на различных языках с помощью «клонированного» голоса. Для этого достаточно предоставить короткий 15-секундный образец голоса человека, который нужно воссоздать, и ввести в сервисе текст, который требуется озвучить. Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. В то же время нейросеть таит в себе немало потенциальных угроз и может стать еще одним орудием мошенников. Впрочем, сами создатели инструмента уверяют, что «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель». В OpenAI также рассказали, что разработка Voice Engine началась в конце 2022 года и в процессе обучения модели использовались как лицензированные, так и открыты

Компания OpenAI представила нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера.

Разработка позволит озвучить текст на различных языках с помощью «клонированного» голоса. Для этого достаточно предоставить короткий 15-секундный образец голоса человека, который нужно воссоздать, и ввести в сервисе текст, который требуется озвучить.

Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. В то же время нейросеть таит в себе немало потенциальных угроз и может стать еще одним орудием мошенников. Впрочем, сами создатели инструмента уверяют, что «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель».

В OpenAI также рассказали, что разработка Voice Engine началась в конце 2022 года и в процессе обучения модели использовались как лицензированные, так и открытые данные. На данный момент сервис не является общедоступным. Когда его откроют для широкой публики, не сообщается.

Незадолго до этого ученые из России и Германии создали приложение на базе искусственного интеллекта, которое позволяет управлять музыкой. С помощью голосовых команд, жестов или мимики пользователь может попросить программу воспроизвести мелодию абсолютно по-другому, создавая, таким образом, уникальные варианты произведения.

Нейросети и ИИ

80,9 тыс интересуются