VALL-E может анализировать тон, высоту и эмоциональный окрас спикера, чтобы искусственный голос вообще не отличался от настоящего. Нейросеть разбивает слова человека на отдельные части и анализирует каждую из них. Затем эти фрагменты сопоставляются с теми, что есть в базе данных VALL-E (более 60 000 часов речи). Послушать работу алгоритмов можно на видео. Слева – голос человека, справа – результаты VALL-E:В чем плюсы Эту нейросеть можно использовать в кино, например, для озвучки актеров, которых нет в живых. Также можно «воскрешать» голоса исполнителей, чтобы выпускать новые песни с их участием. Еще VALL-E стал бы отличным инструментом для дикторов и тех, кто озвучивает аудиокниги. В чем минусы Появление нейросети от Microsoft может вызвать огромную волну мошеннических схем. Злоумышленник может заполучить голос вашего близкого, а затем «оцифрованный» спикер будет звонить вам, представляясь знакомым человеком. Идеальная схема для вымогательства. Также с VALL-E может появиться много «пир
Microsoft научила нейросети подделывать голос за 3 секунды (слушать)
10 января 202310 янв 2023
50
1 мин