Приветствую!
Разработчики компании Stability AI выпустили Stable Video Diffusion - первую базовую модель для генеративного видео, основанную на модели изображения Stable Diffusion. (SVD) Изображение-в-видео — это модель скрытой диффузии, обученная генерировать короткие видеоклипы на основе обработки изображения. Эта модель была обучена генерировать 25 кадров с разрешением 576x1024 с учетом контекстного кадра того же размера, точно настроенного из SVD Image-to-Video [14 кадров] . Есть возможность использовать декодер f8 для обеспечения временной согласованности. Для удобства здесь лежит дополнительно стандартный покадровый декодер. Конкурентоспособная производительность Stable Video Diffusion выпускается в виде двух моделей преобразования изображения в видео, способных генерировать 14 и 25 кадров с настраиваемой частотой кадров от 3 до 30 кадров в секунду. Для исследовательских целей мы рекомендуем наш generative-models репозиторий Github ( см. Репозиторий) ), в котором реализованы са