На arXiv вышла работа AI-Infra-Guard, фреймворк для тестирования безопасности агентных систем. Авторы разбивают фреймворк на 4 слоя: 🔹 Инфраструктурный слой: движки вывода, серверы моделей, API обслуживания 🔹 Протокольный слой: MCP-серверы, API, плагины, внешние инструменты 🔹 Агентный слой: планировщик, память, маршрутизатор инструментов, исполнитель 🔹 Модельный слой: обработка промптов, управление контекстом, логика рассуждений 🧐 Каждый слой ломается по-разному ➖На инфраструктурном уровне: — открытые административные интерфейсы — слабая аутентификация в системе обслуживания моделей — отравленные артефакты моделей — небезопасные механизмы горячего обновления ➖На протокольном уровне: — вредоносная регистрация MCP-инструментов — подмена схемы вызовов — скрытая передача аргументов — имитация легитимных инструментов ➖На агентном уровне: — рекурсивные циклы вызова инструментов — повышение привилегий через цепочки вызовов — отравление памяти — захват контекста выполнения ➖На мод