VASA-1 способна воспроизводить выражения лица, движения губ, синхронизированные с речью, а также естественные движения головы. Новая нейросеть от Microsoft способна улавливать широкий спектр эмоций и тонкие нюансы, делая сгенерированные лица более реалистичными.
Пользователи могут задавать направление взгляда персонажа, воспринимаемое расстояние и даже эмоциональное состояние персонажа.
VASA-1 достигает высокого реализма путем разделения черт лица, трёхмерного положения головы и выражений лица на отдельные компоненты.
Разработчики VASA-1 подчеркивают эффективность работы системы в режиме реального времени. Система способна создавать видео
разрешением 512×512 пикселей и частотой 45 кадров в секунду.