📝 Кратко: ИИ-подразделение компании *Meta представило Perception Encoder Audiovisual (PE-AV) - мультимодальную модель, которая объединяет аудио, видео и текст в единое пространство эмбеддингов. PE-AV является техническим ядром, лежащим в основе SAM Audio, и предназначена для улучшения понимания сцены в задачах, где важно учитывать синхронный контекст изображения и звука. Читать далее 🔗 Читать оригинальную статью (ссылка) 📊 Источник: Habr ⏰ Время: 19.12.2025 12:31 📱 Другие каналы: 🪙 ВКрипту | 🎮 ВИгрухи | 🏎️ ВТачки | ✈️ ВТравелу #gadgets #гаджеты #технологии
⚡ *Meta запускает PE-AV — аудио-визуальный энкодер для мультимодального ИИ
СегодняСегодня
~1 мин