Команда из Microsoft Research Asia разработала новый инструмент искусственного интеллекта под названием VASA-1, который может генерировать очень реалистичные поддельные видеоролики или так называемые "дипфейки". VASA-1 берет статичное изображение или рисунок человека и объединяет его с аудиозаписью речи. За считанные секунды инструмент способен сгенерировать видео, где "ожившее" изображение двигает губами и головой, имитируя произнесение фразы на аудио. При этом мимика "виртуального диктора" выглядит очень естественно.Созданные VASA-1 ролики кажутся вполне реалистичными при просмотре. При ближайшем рассмотрении можно заметить некоторую "зароботизированность" движений головы, но в целом эффект впечатляет. Это подтверждается и опубликованными видео с демонстрацией возможностей инструмента.Разработчики VASA-1 не спешат выпускать его в свободный доступ, поскольку понимают потенциальную опасность технологии для создания фейковых и вредоносных видео с участием реальных людей. По их словам, инструмент будет предоставлен широкой аудитории, только когда появятся гарантии его ответственного использования в соответствии с правилами этики ИИ.В перспективе разработчики видят применение VASA-1 в сферах, где нужна имитация человеческого общения, в частности для оказания психологической поддержки, виртуальных помощников на основе ИИ и т.д. Кроме того, технологию планируется использовать для усовершенствования инструментов распознавания поддельных видео. Выпуск VASA-1 совпал по времени с другим инцидентом, связанным с этическими рисками технологий ИИ. Ранее на этой неделе Microsoft пришлось отключить только что запущенную модель искусственного интеллекта WizardLM-2 из-за незавершенного тестирования на "токсичность". Этот кейс еще раз продемонстрировал важность тщательной оценки последствий использования передовых инструментов ИИ.
Microsoft создала ИИ инструмент VASA-1 для генерации реалистичных дипфейков
23 апреля 202423 апр 2024
12
1 мин