Самая опасная уязвимость современных ИИ-агентов — это атаки класса Remote Code Execution и Indirect Prompt Injection, когда агент читает заражённую веб-страницу или документ и начинает выполнять команды злоумышленника. E2B Sandbox 🟢 — Фактически стандарт де-факто для безопасного запуска ИИ-агентов. Это изолированная среда (микро-ВМ на базе Firecracker), где агент может выполнять сгенерированный код, не рискуя скомпрометировать хост-систему. Без такой изоляции пускать агента писать код — инженерное самоубийство. LlamaGuard 🔬🟢 — Специализированная линейка моделей (уже вышли версии 1, 2 и 3) исключительно для классификации входных и выходных данных агента на предмет вредоносного контента, инструкций по созданию оружия, фишинга и т.д. Работает быстрее и предсказуемее универсальных LLM. Promptfoo 🟢 — Утилита для CI/CD автоматизации тестирования промптов и приложений на базе LLM. Позволяет нативно внедрять в пайплайн проверки на инъекции, утечку системного промпта (system prompt leaka