Агенты, основанные на больших языковых моделях (LLM), всё чаще решают сложные задачи, включая эксплуатацию реальных уязвимостей. Традиционные агенты часто сталкиваются с трудностями при выявлении уязвимостей нулевого дня, когда эксплойт неизвестен. Однако новая методика иерархического планирования и агентов, ориентированных на конкретные задачи (HPTSA), меняет правила игры. Как работает HPTSA? Архитектура HPTSA включает три основных компонента: Каждый экспертный агент получает подсказки и доступ к соответствующим документам, что позволяет эффективно сосредоточиться на своей задаче. Такой структурированный подход обеспечивает высокую эффективность и целенаправленность в выявлении и эксплуатации уязвимостей. Эффективность нового метода В тестировании HPTSA было рассмотрено 15 реальных веб-уязвимостей, появившихся после окончания сбора данных GPT-4. Результаты впечатляют: HPTSA успешно взломал 8 из этих 15 уязвимостей. Этот показатель значительно превышает результаты традиционных сканеров