⚡ DeepDigest.ru arXiv cs.CV · 29 Jun 2026 Исследователи разработали DMV-Bench — первый интерактивный тест для оценки зрительной памяти мультимодальных агентов. Тест работает на основе каталога из 1000 товаров для дома: агент посещает изображения товаров, запоминает уникальную информацию и позже должен вспомнить конкретный товар и перейти по его URL. Авторы также предложили архитектуру памяти DualMem, которая параллельно обрабатывает визуальную и текстовую информацию. В тестах DualMem показала лучшие результаты по сравнению с другими мультимодальными системами (Gemini 2.5 Flash и Qwen2.5-VL-7B) при разной длине цепочки действий (5, 10, 15, 50 шагов). 🔗 Читать на сайте #arxivcscv #ИИ #технологии
Новый тест DMV-Bench: как проверить зрительную память ИИ-агентов
ВчераВчера
~1 мин