Добавить в корзинуПозвонить
Найти в Дзене
Нейро Отличник

LongCat-Video-Avatar 1.5: обновление для создания говорящих аватаров

Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными. LongCat-Video-Avatar 1.5 поддерживает несколько режимов генерации: Модель распространяется по лицензии MIT, оптимизирована через DMD2‑based step distillation (8 NFE) и поддерживает как однопоточное, так и многопоточное аудио. Это позволяет использовать её для самых разных задач — от анимации персонажей до создания длинных диалоговых сцен. Исходный код и модели доступны на GitHub и Hugging Face. Нейро Отличник www.neurootlichnik.ru

Вышла новая версия LongCat-Video-Avatar 1.5 — модели от Meituan, которая превращает статичные изображения в видео с говорящими персонажами. Ключевая особенность обновления — стабильная работа с длинными роликами и точная синхронизация губ с аудиодорожкой благодаря интеграции Whisper‑Large. Модель одинаково уверенно справляется с людьми, аниме-персонажами и даже животными.

LongCat-Video-Avatar 1.5 поддерживает несколько режимов генерации:

  • создание видео по аудио и тексту (AT2V),
  • генерация по аудио, тексту и изображению (ATI2V),
  • продолжение уже существующих видео (Video Continuation).

Модель распространяется по лицензии MIT, оптимизирована через DMD2‑based step distillation (8 NFE) и поддерживает как однопоточное, так и многопоточное аудио. Это позволяет использовать её для самых разных задач — от анимации персонажей до создания длинных диалоговых сцен.

Исходный код и модели доступны на GitHub и Hugging Face.

Нейро Отличник www.neurootlichnik.ru