Найти в Дзене
SecureTechTalks

🤖⚔️ AI против хакеров: автономный агент уничтожил CTF-соревнования в 2025

🤖⚔️ AI против хакеров: автономный агент уничтожил CTF-соревнования в 2025 Кибербезопасность переживает момент, который обычно описывают фразой “тихая революция”. Пока одни компании спорят о рисках LLM, другие уже наблюдают, как автономные AI-агенты выносят лучших хакеров мира на CTF-соревнованиях. Ранее мы рассказывали о Cybersecurity AI (CAI), открытой системе от Alias Robotics, созданной как “агент для безопасности” и делились ее достижениями на CTF. Однако история имеет продолжение. 🏆 Успех 2025 За год CAI стал #1 в мире сразу в нескольких крупнейших CTF-турнирах: 🚀 Neurogrid AI Showdown: 1 место, 41/45 задач, 33 917 очков 🛠 Dragos OT CTF: 1 место в первые часы, итог в топ-10 🧩 HTB AI vs Humans: #1 среди AI, 19/20 задач 🕵️ Cyber Apocalypse: #22 из 8129 команд, работая всего 3 часа 🧨 Pointer Overflow: за 60 часов догнал результаты команд, которые играли 50 дней Самый эффектный результат на Neurogrid CTF, где CAI набрал 9 692 очка за первый час (для сравнения: люди шли к э

🤖⚔️ AI против хакеров: автономный агент уничтожил CTF-соревнования в 2025

Кибербезопасность переживает момент, который обычно описывают фразой “тихая революция”. Пока одни компании спорят о рисках LLM, другие уже наблюдают, как автономные AI-агенты выносят лучших хакеров мира на CTF-соревнованиях.

Ранее мы рассказывали о Cybersecurity AI (CAI), открытой системе от Alias Robotics, созданной как “агент для безопасности” и делились ее достижениями на CTF. Однако история имеет продолжение.

🏆 Успех 2025

За год CAI стал #1 в мире сразу в нескольких крупнейших CTF-турнирах:

🚀 Neurogrid AI Showdown: 1 место, 41/45 задач, 33 917 очков

🛠 Dragos OT CTF: 1 место в первые часы, итог в топ-10

🧩 HTB AI vs Humans: #1 среди AI, 19/20 задач

🕵️ Cyber Apocalypse: #22 из 8129 команд, работая всего 3 часа

🧨 Pointer Overflow: за 60 часов догнал результаты команд, которые играли 50 дней

Самый эффектный результат на Neurogrid CTF, где CAI набрал 9 692 очка за первый час (для сравнения: люди шли к этой же цифре сутки.).

⚡ В чем секрет?

Как вы помните, CAI не просто LLM-обёртка, внутри серьёзная агентная архитектура, оптимизированная под постоянную работу:

🧠 alias1 - быстрый и дешёвый базовый LLM, обученный на данных ИБ;

🧮 динамическое переключение моделей по энтропии: если базовая модель сомневается, то подключается Opus 4.5;

💸 экономия 98% стоимости: 1 млрд токенов стоит не $5940, а $119;

🔁 длительная автономная работа: устойчивость к ошибкам, сохранение состояния, восстановление контекста.

🎯 CTF уже не торт

Картина неприятная:

🧨 Jeopardy-CTF больше не измеряют человеческий скилл

Если AI решает задачи быстрее и почти безошибочно,

значит формат стал тестом на скорость вычислений, а не на знание и творчество.

🛡 Реальный мир ≠ CTF

Даже CAI не справляется с последними 5% задач, где нужны:

- контекст,

- миропонимание,

- выводы за пределами шаблонов.

⚔️ Будущее Attack & Defense

Статические задачки из категории “найди баг и получи флаг” AI уже “закрыл”.

Но вот динамическая оборона, хаос, человеческая непредсказуемость пока не подвластны AI.

🏭 Неприятный момент

Если автономный агент проходит CTF за 6 часов,

то злоумышленник, пусть и не столь продвинутый, скоро тоже сможет запускать такие системы. Отсюда выводы:

🔐 Защита должна работать на скорости машин

Ручные расследования, ручной threat hunting и “после обеда глянем лог” уходят в прошлое.

🧱 AI-агенты должны стать частью обороны

Да, есть риски, да, есть этика. Но альтернативой является  отставание от атакующих на годы.

🔧 Главное технологическое открытие

CAI доказал, что автономные агенты могут быть быстрыми, устойчивыми,

и одновременно крайне дешёвыми.

Это значит, что каждый SOC, каждая IT-компания, каждый облачный провайдер может запустить:

непрерывный AI-анализ логов,

круглосуточный AI-pentest,

автоматизированную OT-проверку уязвимостей,

постоянный CTI-мониторинг.

То, что раньше стоило “как ещё один SOC”, теперь доступно по цене чашки кофе.

🔗 репозиторий CAI на GitHub можно посмотреть по ссылке

Stay secure and read SecureTechTalks 📚

#️⃣ #кибербезопасность #ai #cybersecurity #ctf #aiagents #infosec #secops #отраслеваябезопасность #neurogrid #securetechtalks #llm