Исследователи из Института интеллектуальных вычислений Alibaba разработали новую систему искусственного интеллекта под названием “EMO”, сокращенно от Emote Portrait Alive, которая может анимировать одну фотографию портрета и создавать видеоролики, на которых человек говорит или поет удивительно реалистично.
Система, описанная в исследовательском документе, опубликованном на arXiv, способна создавать плавные и выразительные движения лица и позы головы, которые точно соответствуют нюансам предоставленной звуковой дорожки. Это представляет собой значительный прогресс в создании видео с говорящими головами на основе звука - области, которая годами бросала вызов исследователям искусственного интеллекта. “Традиционные методы часто не позволяют передать весь спектр человеческих выражений и уникальность индивидуальных черт лица”, - сказал ведущий автор Линруй Тянь в статье. “Для решения этих проблем мы предлагаем EMO, новую платформу, которая использует прямой подход синтеза аудио в видео, ми