Компания Цукербергера представила генеративную модель для синтеза голоса

Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу.3DNews
При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово.3DNews
Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский.3DNews
Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.3DNews