LiveAvatar — это передовой фреймворк от команды Alibaba Quark, разработанный для создания фотореалистичных цифровых аватаров, полностью управляемых аудиосигналом. Система построена на базе мощной диффузионной модели с 14 миллиардами параметров и решает одну из главных проблем генерации видео — создание непрерывных длинных потоков без потери качества, визуальных артефактов или рассинхронизации. - Бесконечная генерация (Infinite Length): Поддержка непрерывного стриминга длительностью более 10 000 секунд. Используемый механизм Rolling Sink Frame (RSFM) динамически калибрует изображение, предотвращая "дрейф" внешности и искажение цветов, свойственные обычным диффузионным моделям. - Высокая производительность в реальном времени: Обеспечивает скорость генерации до 20 кадров в секунду. Технология Timestep-forcing Pipeline Parallelism (TPP) эффективно распределяет этапы шумоподавления, устраняя узкие места последовательной обработки. - Универсальность контента: Фреймворк демонстрирует высокую
LiveAvatar: Генерация реалистичных аватаров в реальном времени с бесконечной длительностью
17 февраля17 фев
1
1 мин