Исследователи из M-A-P, Пекинского университета почты и телекоммуникаций и лаборатории NJU-LINK Нанкинского университета, совместно представили AutoMV, первую систему с открытым исходным кодом, не требующую обучения, предназначенную для создания полноценных музыкальных клипов (MV) с последовательным повествованием, длительностью в несколько минут. Традиционные модели AI для генерации видео испытывают трудности с длинными музыкальными произведениями из-за ограничений по продолжительности, рассогласования аудио и видео, а также плохой согласованности персонажей. AutoMV решает эти проблемы, имитируя профессиональный производственный процесс и разделяя задачу на четыре этапа: предварительная обработка музыки, написание сценария и режиссура, генерация видео и итеративная проверка. Система использует инструменты для разделения вокала и аккомпанемента, извлечения текста и анализа структуры песни. Специализированные агенты выступают в роли «сценариста» и «режиссера», генерируя раскадровки и
AutoMV: Первый в открытом доступе ИИ-агент для создания полноценных музыкальных клипов, достигающий повествования в такт музыке
30 декабря 202530 дек 2025
2 мин