Google представил новую технологию искусственного интеллекта - VLOGGER. Это программный продукт, который позволит создавать видеоролики с говорящими людьми на основе одного изображения и аудиофайла. Новая система стала возможно благодаря использованию генеративных диффузионных моделей, что отличает VLOGGER от предыдущих разработок. Метод не требует индивидуального обучения для каждого человека и способен работать без обнаружения и обрезки лиц, генерируя полные изображения, включая лицо и туловище, в различных сценариях. Система VLOGGER работает в два этапа: первый этап принимает в качестве входных данных форму аудиосигнала для создания промежуточных элементов управления движением тела, которые отвечают за взгляд, мимику и позу; второй этап представляет собой временную модель преобразования image-to-image, которая предсказывает дальнейшие движения тела для генерации соответствующих кадров. Чтобы привязать процесс к определенной личности, VLOGGER также использует эталонное изображение че
Google представила ИИ-модель VLOGGER для мгновенного создания видео с говорящими людьми
20 марта 202420 мар 2024
19
1 мин