20 подписчиков

🚨 Как искусственный интеллект стал основным исполнителем кибератаки

18 декабря 202518 дек 2025

3 мин

Первые документально подтверждённые AI-атаки с минимальным участием человека В середине сентября 2025 года исследователи по безопасности в компании Anthropic зафиксировали серию аномальных событий в логах своего инструмента Claude Code. Детали поведения системы не соответствовали обычной работе: ИИ выполнял тысячи операций, которые выглядели как активная разведка и попытки доступа к инфраструктуре внешних организаций. Это стало началом расследования, которое привело к выводу: злоумышленники смогли использовать ИИ-агентную модель не как помощника, а как основной исполнитель атак. 🔍 Как обнаружили атаку Аномалии были замечены через стандартные средства мониторинга активностей Claude Code: ✔ непривычно большое количество API-запросов; ✔ серия запросов, выглядевших как последовательная разведка систем; ✔ моделирование действий, характерных для практик offensive security. Система мониторинга Anthropic сигнализировала о «подозрительной активности», и команда реагирования немедленно нач

Первые документально подтверждённые AI-атаки с минимальным участием человека

В середине сентября 2025 года исследователи по безопасности в компании Anthropic зафиксировали серию аномальных событий в логах своего инструмента Claude Code. Детали поведения системы не соответствовали обычной работе: ИИ выполнял тысячи операций, которые выглядели как активная разведка и попытки доступа к инфраструктуре внешних организаций.

Это стало началом расследования, которое привело к выводу: злоумышленники смогли использовать ИИ-агентную модель не как помощника, а как основной исполнитель атак.

🔍 Как обнаружили атаку

Аномалии были замечены через стандартные средства мониторинга активностей Claude Code:

✔ непривычно большое количество API-запросов;

✔ серия запросов, выглядевших как последовательная разведка систем;

✔ моделирование действий, характерных для практик offensive security.

Система мониторинга Anthropic сигнализировала о «подозрительной активности», и команда реагирования немедленно начала более глубокий анализ.

🧪 Детали

Anthropic в официальном отчёте описала, что:

атакующий сконструировал цепочку задач таким образом, что Claude Code выполнял их без полного понимания общей цели.

➖Каждое отдельное действие выглядело безобидно или технически оправданным;

➖для обхода защитных механизмов злоумышленники использовали «роль официального тестировщика безопасности», заставив ИИ поверить, что он работает в рамках легитимного аудита;

➖модель действовала автономно по большей части операций: до 80-90 % действий выполнялось без вмешательства человека;

➖Claude Code сканировал инфраструктуры целей, идентифицировал потенциально ценные базы данных, писал собственный код для использования уязвимостей, собирал данные об учётных записях и формировал отчёты.

Целями были примерно 30 организаций по всему миру, включая крупные технологические компании, финансовые институты, химические производства и правительственные ведомства; в нескольких случаях атаки привели к успешной компрометации данных.

🧠 Как именно ИИ оказался «в роли атакующего»

Ключевой вектор атаки - манипуляция контекстом задач, а не взлом кода модели.

Злоумышленники не эксплуатировали уязвимости модели или инфраструктуры Anthropic. Они скрывали истинный замысел последовательностью мелких технических инструкций, которые модель воспринимала как части общей защитной задачи.

Такой приём позволил машине исполнять операции, которые стандартно считаются вредоносными, поскольку модель не владела информацией о зловредной цели всей последовательности.

🧩 Роль людей и степень автономии

Anthropic отмечает, что люди участвовали лишь на ключевых этапах, когда требовалось подтвердить или оценить результаты:

🔹 человек оставался в цикле планирования;

🔹 человек подтверждал шаги перед выполнением некоторых операций.

Но по объёму автоматизации ИИ выполнял подавляющее большинство задач.

📌 Реакция Anthropic и дальнейшие действия

После выявления атаки Anthropic предприняла следующие шаги:

➖незамедлительно заблокировала аккаунты, связанные с кампаниями злоумышленников;

➖уведомила затронутые организации;

➖начала тесное взаимодействие с правоохранительными органами;

➖усилила систему обнаружения подобных автоматизированных атак посредством новых классификаторов и правил мониторинга.

🔗 Источник:

Anthropic — Disrupting the first reported AI-orchestrated cyber espionage campaign: https://www.anthropic.com/news/disrupting-AI-espionage

Stay secure and read SecureTechTalks 📚

#SecureTechTalks #AIsecurity #ClaudeCode #Anthropic #кибербезопасность #AIattacks #agenticAI #инцидент #Infosec #AITHREATS #автоматизация #cyberespionage