Компания OpenAI представила нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера.
Разработка позволит озвучить текст на различных языках с помощью «клонированного» голоса. Для этого достаточно предоставить короткий 15-секундный образец голоса человека, который нужно воссоздать, и ввести в сервисе текст, который требуется озвучить.
Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. В то же время нейросеть таит в себе немало потенциальных угроз и может стать еще одним орудием мошенников. Впрочем, сами создатели инструмента уверяют, что «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель».
В OpenAI также рассказали, что разработка Voice Engine началась в конце 2022 года и в процессе обучения модели использовались как лицензированные, так и открытые данные. На данный момент сервис не является общедоступным. Когда его откроют для широкой публики, не сообщается.
Незадолго до этого ученые из России и Германии создали приложение на базе искусственного интеллекта, которое позволяет управлять музыкой. С помощью голосовых команд, жестов или мимики пользователь может попросить программу воспроизвести мелодию абсолютно по-другому, создавая, таким образом, уникальные варианты произведения.
Читайте также:
На заводе «Уралмашзавод» произошел пожар
Зависимость экономики России от экспорта стала минимальной с 1990-х
В Амурской области прекратили искать 13 пропавших под обвалом горняков