26 подписчиков

LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров

4 июня4 июн

~1 мин

Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными. LongCat-Video-Avatar 1.5 поддерживает несколько режимов генерации: Модель распространяется по лицензии MIT, оптимизирована через DMD2‑based step distillation (8 NFE) и поддерживает как однопоточное, так и многопоточное аудио. Это позволяет использовать её для самых разных задач — от анимации персонажей до создания длинных диалоговых сцен. Исходный код и модели доступны на GitHub и Hugging Face. Нейро Отличник www.neurootlichnik.ru

Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными.

LongCat-Video-Avatar 1.5 поддерживает несколько режимов генерации:

создание видео по аудио и тексту (AT2V),
генерация по аудио, тексту и изображению (ATI2V),
продолжение уже существующих видео (Video Continuation).

Модель распространяется по лицензии MIT, оптимизирована через DMD2‑based step distillation (8 NFE) и поддерживает как однопоточное, так и многопоточное аудио. Это позволяет использовать её для самых разных задач — от анимации персонажей до создания длинных диалоговых сцен.

Исходный код и модели доступны на GitHub и Hugging Face.

Нейро Отличник www.neurootlichnik.ru

LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров

LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров