Добавить в корзинуПозвонить
Найти в Дзене

Новый тест DMV-Bench: как проверить зрительную память ИИ-агентов

⚡ DeepDigest.ru arXiv cs.CV · 29 Jun 2026 Исследователи разработали DMV-Bench — первый интерактивный тест для оценки зрительной памяти мультимодальных агентов. Тест работает на основе каталога из 1000 товаров для дома: агент посещает изображения товаров, запоминает уникальную информацию и позже должен вспомнить конкретный товар и перейти по его URL. Авторы также предложили архитектуру памяти DualMem, которая параллельно обрабатывает визуальную и текстовую информацию. В тестах DualMem показала лучшие результаты по сравнению с другими мультимодальными системами (Gemini 2.5 Flash и Qwen2.5-VL-7B) при разной длине цепочки действий (5, 10, 15, 50 шагов). 🔗 Читать на сайте #arxivcscv #ИИ #технологии

Новый тест DMV-Bench: как проверить зрительную память ИИ-агентов

DeepDigest.ru

arXiv cs.CV · 29 Jun 2026

Исследователи разработали DMV-Bench — первый интерактивный тест для оценки зрительной памяти мультимодальных агентов. Тест работает на основе каталога из 1000 товаров для дома: агент посещает изображения товаров, запоминает уникальную информацию и позже должен вспомнить конкретный товар и перейти по его URL. Авторы также предложили архитектуру памяти DualMem, которая параллельно обрабатывает визуальную и текстовую информацию. В тестах DualMem показала лучшие результаты по сравнению с другими мультимодальными системами (Gemini 2.5 Flash и Qwen2.5-VL-7B) при разной длине цепочки действий (5, 10, 15, 50 шагов).

🔗 Читать на сайте #arxivcscv #ИИ #технологии