10,2 тыс подписчиков
🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation
Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.
git clone git@github.com:guyyariv/TempoTokens.git
🖥 Github: https://github.com/guyyariv/TempoTokens
📕 Paper: https://arxiv.org/abs/2309.16429v1
⭐️ Dataset: https://paperswithcode.com/dataset/audioset
Около минуты
30 сентября 2023