Найти тему
76 подписчиков

ExVideo: пост-тюнинг техника, направленная на расширение возможностей моделей генерации видео. В ход идут: 3D convolution, temporal attention, и positional embeddings.


Для демонстрации авторы сделали версию SVD, которая генерит длинные видео (до 128 кадров, что ~5 сек на 24/кс или ~11 сек на 12 к/с) с довольно стабильной и чёткой картинкой.

ExVideo: пост-тюнинг техника, направленная на расширение возможностей моделей генерации видео. В ход идут: 3D convolution, temporal attention, и positional embeddings.
00:25
Около минуты