На GitHub появился Agent Threat Rules, open-source проект, который стандартизирует обнаружение атак на агентские системы. ⚙️ А это вообще нужно? Телеметрия безопасности современных AI-агентов хаотична. Есть: 🔹 вызовы инструментов 🔹 доступ к памяти 🔹 прохождение prompt’ов 🔹 ответы модели 🔹 взаимодействие между агентами 🔹 обращения к RAG Но почти нет нормального уровня обнаружения угроз. Agent Threat Rules предлагает фреймворк обнаружения угроз, где сценарии атак описываются в виде машиночитаемых правил. Подход похож на detection engineering в SOC: 💥 сигнал → условие → индикаторы → критичность → контекст защиты 🔬 Что ищем? Правила построены вокруг угроз, характерных именно для агентов, а не классических индикаторов компрометации. 1⃣ Prompt injection Правила пытаются замечать: 🔹 попытки переопределить системные инструкции 🔹 перехват поведения агента 🔹 скрытую смену логики работы 🔹 попытки заставить модель игнорировать политики Например: игнорируй предыдущие инстру