Найти тему

Новый голосовой AI от Microsoft так хорош, что компания боится его выпускать


Команда разработчиков называет нейросеть VALL-E 2 первой голосовой системой, достигшей человеческого уровня в генерации речи из текста. Она может генерировать сложную речь, обучившись всего по трехсекундному отрывку с записью человеческого голоса. При этом, лучшие результаты VALL-E 2 показывает, обучаясь на десятисекундных записях.

В связи с высоким риском использования VALL-E 2 в целях мошенничества, Microsoft не открывает общий доступ к нейросети. В данный момент она остается исследовательским проектом.

Примеры сгенерированной речи можно оценить здесь: https://www.microsoft.com/en-us/research/project/vall-e-x/vall-e-2/


Claude 3.5 Sonnet уже доступен в c.aiacademy.me
Около минуты