76 подписчиков
ExVideo: пост-тюнинг техника, направленная на расширение возможностей моделей генерации видео. В ход идут: 3D convolution, temporal attention, и positional embeddings.
Для демонстрации авторы сделали версию SVD, которая генерит длинные видео (до 128 кадров, что ~5 сек на 24/кс или ~11 сек на 12 к/с) с довольно стабильной и чёткой картинкой.
Около минуты
23 июня 2024