Инженеры Meta рассказали о нейросетевой модели Voicebox, которая обладает широкими возможностями по работе с устной речью: генерация, редактирование или стилизация по образцу.3DNews

При необходимости можно даже «переиграть» фрагмент записи, точечно исправив, например, неправильно произнесённое слово.3DNews

Поддерживаются шесть языков: английский, французский, немецкий, испанский, польский и португальский.3DNews

Voicebox может использоваться в качестве синхронного переводчика, передавая голос и манеру речи собеседника.3DNews

Компания Цукербергера представила генеративную модель для синтеза голоса