Найти тему
10,2 тыс подписчиков

🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation


Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ.

git clone git@github.com:guyyariv/TempoTokens.git




🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation  Модель генерации реалистичных видео из Аудио.
00:39
Около минуты