Разработка Microsoft VASA-1 может создать реалистичную «говоряющую голову» на основе всего одной фотографии и аудиоклипа. На днях Microsoft представила новый инструмент на базе искусственного интеллекта VASA-1, который умеет создавать реалистичные видеоролики с лицами говорящих людей. Для генерации нужна всего одна фотография и аудиоклип. Система способна воссоздать широкий спектр эмоций и даже микровыражения с учетом наклона головы и точных движений губ. Инструмент на базе искусственного интеллекта VASA-1 умеет генерировать видеоролики в лицами со скоростью до 40 кадров в секунду и даже встраивает «задержку», создающую основу для разговорного взаимодействия в реальном времени. Так что будет нелегко определить, кто же перед вами на экране – настоящий человек или человекоподобный аватар. Технологию планируют применять достаточно широко: в сфере здравоохранения, в образовании, в игровых средах и конечно же в услугах и розничной торговле. Беспокойство вызвано тем, что у технологи
Джоконда молчала 520 лет, но теперь она расскажет всё!
30 мая 202430 мая 2024
13
1 мин