Почти каждый проект с AI-агентами сегодня заявляет: «Мы уделяем внимание безопасности». На практике это часто означает формальное тестирование в духе. Что-то в духе следующего сценария: — 📩 Это фишинг? — 🤖 Да. По итогу получаем accuracy в 90+ %. Однако жизнь сложнее. Никто не проверяет каждое письмо или ссылку. Агенту ставят задачу: «Разбери входящие и обработай срочные счета». И дальше всё решает его поведение, а не способность классифицировать текст. Чтобы проверять поведение агентов, команда 1Password выпустила open-source инструмент SCAM (Security Comprehension Awareness Measure). 🧠 Подробнее SCAM не датасет и не набор тестов. Это полноценная изолированная среда, в которой агент работает почти как в продакшене. Под капотом: 🗂 YAML-сценарии 📬 Sandbox-почта 🔐 Vault с тестовыми credential 🌐 Браузер 📁 Файловая система 📊 Механизм оценки действий 🛡Контур изолирован Главное в решении - это multi-turn логика. Агент получает задачу → выполняет действия → получает новый конт