Стартап под названием VLOGGER анонсировал разработку инновационного метода генерации текстового и аудио-видео контента на основе одного входного изображения человека. Этот метод основан на последних достижениях в области генеративного распространения и представляет собой совокупность стохастической модели диффузии движения человека в 3D и новой архитектуры, которая дополняет модели преобразования текста в изображение как временным, так и пространственным контролем.Основная цель проекта VLOGGER заключается в создании высококачественных видеороликов переменной длины, которыми легко управлять, с помощью высокоуровневого представления человеческих лиц и тел. Отличительной особенностью данного метода является то, что он не требует обучения каждого человека, не полагается на распознавание и обрезку лиц, а также способен генерировать полное изображение человека, а не только лицо или губы. Кроме того, VLOGGER учитывает широкий спектр сценариев, что имеет решающее значение для правильного синте
Команда исследователей Google рассказала о новой нейросети VLOGGER
17 марта 202417 мар 2024
32
1 мин