Новый голосовой AI от Microsoft так хорош, что компания боится его выпускать
Команда разработчиков называет нейросеть VALL-E 2 первой голосовой системой, достигшей человеческого уровня в генерации речи из текста. Она может генерировать сложную речь, обучившись всего по трехсекундному отрывку с записью человеческого голоса. При этом, лучшие результаты VALL-E 2 показывает, обучаясь на десятисекундных записях.
В связи с высоким риском использования VALL-E 2 в целях мошенничества, Microsoft не открывает общий доступ к нейросети. В данный момент она остается исследовательским проектом.
Примеры сгенерированной речи можно оценить здесь: https://www.microsoft.com/en-us/research/project/vall-e-x/vall-e-2/
—
Claude 3.5 Sonnet уже доступен в c.aiacademy.me
Около минуты
5 июля 2024