Инженеры из Avast выпустили open-source инструмент SAGE, фреймворк для автоматизированного тестирования безопасности LLM-приложений. 🧠 О чем речь? SAGE (Security Assessment Generation Engine) - open-source платформа, которая помогает находить уязвимости в LLM-системах. Другими словами, это red team для AI, который позволяет моделировать атаки на: 🔹 чат-ботов 🔹 AI-агентов 🔹 RAG-системы 🔹 LLM-ассистентов внутри корпоративных сервисов SAGE генерирует вредоносные промпты, запускает сценарии атак и анализирует реакцию моделей. ⚠️ Какие атаки ищет? SAGE ориентирован на самые распространённые классы угроз для LLM-приложений: 💣 Prompt Injection когда модель выполняет скрытые инструкции из внешнего контента. 📤 Data Exfiltration модель начинает выдавать внутренние данные, которые не должна раскрывать. 🧨 Jailbreak-атаки обход встроенных ограничений и политик безопасности. 🧩 RAG-манипуляции когда вредоносный документ заставляет модель делать неожиданные действия. Фактически SAGE