Компания Netflix анонсировала запуск нового фреймворка VOID (Video Object Inpainting and Decomposition), который призван усовершенствовать процесс удаления объектов из видеоконтента. В отличие от традиционных методов, такие как «заплаточный» подход, VOID использует механизм декомпозиции сцены, что существенно меняет подход к редактированию видео. Модель разделяет видеопоток на слои фона и динамические маски, что позволяет ей восстанавливать структуру сцены с учетом глубины и перспективы. Особое внимание уделено решению проблемы темпоральной связности, что является сложной задачей для многих диффузионных моделей. С использование специфических механизмов внимания и анализа межкадровых связей, VOID минимизирует артефакты мерцания и «плавающие» текстуры, показывая в сравнительных тестах превосходство над существующим SOTA-решением ProPainter. Архитектурно VOID спроектирована как гибкий пайплайн, работающий с масками любой сложности — от удаления мелких проводов до полной замены крупных объ
Netflix представила фреймворк VOID для автоматизации редактирования видео
3 дня назад3 дня назад
3 мин