MOVA — прорыв в open-source генеративном ИИ: создаёт киноуровневое видео с идеальной синхронизацией звука и изображения, противостоя закрытым системам вроде Sora и Veo. 29 января — команда OpenMOSS совместно со стартапом MOSI официально представила MOVA (MOSS-Video-and-Audio), модель генерации аудиовизуального контента «с начала до конца». MOVA — первая высокопроизводительная открытая модель в Китае, способная к настоящей совместной генерации звука и видео, создавая их одновременно, а не объединяя после генерации. Модель генерирует аудиовизуальные клипы до 8 секунд с разрешением до 720p и демонстрирует производительность уровня индустрии в синхронизации устной речи на нескольких языках и согласовании со звуками окружающей среды. Отличительная черта MOVA — её значение для отрасли. На фоне всё большего закрытия таких систем, как Sora 2 и Veo 3, MOVA применяет подход полной открытости, публикуя веса модели, код обучения, вывода и рецепты донастройки — бросая вызов доминированию проприетар
OpenMOSS и MOSI представили MOVA: открытую аудиовизуальную модель, создающую синхронизированное покадровое покадровое покадровое генерирование!
30 января30 янв
2 мин