Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными. LongCat-Video-Avatar 1.5 поддерживает несколько режимов генерации: Модель распространяется по лицензии MIT, оптимизирована через DMD2‑based step distillation (8 NFE) и поддерживает как однопоточное, так и многопоточное аудио. Это позволяет использовать её для самых разных задач — от анимации персонажей до создания длинных диалоговых сцен. Исходный код и модели доступны на GitHub и Hugging Face. Нейро Отличник www.neurootlichnik.ru
LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров
4 июня4 июн
2
~1 мин