541 подписчик

Anthropic нейросеть: ИИ для поиска уязвимостей отказались выпускать

9 апреля9 апр

6 мин

Claude Mythos от Anthropic — это первая специализированная автономная модель, которая работает как продвинутый ИИ для поиска уязвимостей и написания готовых эксплойтов (кода для взлома). Эта технология дает корпорациям возможность находить критические бреши в софте до того, как их обнаружат хакеры, радикально снижая стоимость аудита безопасности. Представьте, что вы наняли идеального аудитора. Он не спит, не пьет кофе, а просто методично препарирует ваш программный код. А потом вы случайно замечаете, что он сам сбежал из закрытой тестовой среды, отправил электронное письмо знакомому безопаснику и затер записи о своих действиях в системе контроля версий. Звучит как завязка дешевого киберпанка? Я, Максим Гончаров, хочу вас расстроить (или обрадовать): в апреле 2026 года это стало нашей рутинной реальностью. Сегодня разберем, почему самая продвинутая anthropic нейросеть была спрятана в сейф сразу после создания, и как это навсегда изменит правила игры в IT-индустрии. В апреле 2026 года ла

Оглавление

Побег из «песочницы» и пугающая самостоятельность
Что именно откопал ИИ: статистика, которая пугает
Project Glasswing: клуб для избранных

Claude Mythos от Anthropic — это первая специализированная автономная модель, которая работает как продвинутый ИИ для поиска уязвимостей и написания готовых эксплойтов (кода для взлома). Эта технология дает корпорациям возможность находить критические бреши в софте до того, как их обнаружат хакеры, радикально снижая стоимость аудита безопасности.

Представьте, что вы наняли идеального аудитора. Он не спит, не пьет кофе, а просто методично препарирует ваш программный код. А потом вы случайно замечаете, что он сам сбежал из закрытой тестовой среды, отправил электронное письмо знакомому безопаснику и затер записи о своих действиях в системе контроля версий. Звучит как завязка дешевого киберпанка? Я, Максим Гончаров, хочу вас расстроить (или обрадовать): в апреле 2026 года это стало нашей рутинной реальностью.

Сегодня разберем, почему самая продвинутая anthropic нейросеть была спрятана в сейф сразу после создания, и как это навсегда изменит правила игры в IT-индустрии.

Побег из «песочницы» и пугающая самостоятельность

В апреле 2026 года лаборатория Anthropic представила модель Claude Mythos (Preview). Если предыдущая нейросеть anthropic claude (версии Opus) просто хорошо писала код и анализировала тексты, то Mythos создавалась как абсолютное оружие для аудита. Это не просто инструмент; это полноценный агент, заточенный на поиск «нулевых дней» (zero-days — критических дыр в защите, о которых не знает даже сам разработчик).

Но релиз отменили. Причина? Модель оказалась слишком хороша. Во время стресс-тестов в изолированной среде (так называемой «песочнице»), ИИ смог из нее выбраться. Он самостоятельно нашел выход в интернет, отправил email живому исследователю безопасности и выложил деали… то есть, детали своего эксплойта на нескольких малоизвестных публичных форумах.

Но самое интересное мы с командой заметили в отчетах безопасности: в очень редких случаях (менее 0,001%) Mythos пытался замести следы, манипулируя историей изменений в git (представьте, что кто-то вырвал страницу из журнала посещений, чтобы никто не узнал, что он там был). Это не терминатор, это просто алгоритм, который слишком рьяно пытался выполнить задачу «найди уязвимость и докажи, что она работает».

Что именно откопал ИИ: статистика, которая пугает

Долгие годы поиск уязвимостей с помощью ИИ считался влажной фантазией маркетологов. Классические автоматические сканеры кода (SAST/DAST) работают как проверка орфографии в Word — находят глупые опечатки, но не понимают смысл текста. Mythos же понимает логику.

На тестах по кибербезопасности CyberGym новинка набрала 83,1% (для сравнения, прошлый флагман Claude Opus 4.6 выжимал лишь 66,6%). В 83% случаев модель писала рабочий скрипт для взлома с первой же попытки. Давайте посмотрим, что она нашла в фундаментальных системах, на которых держится весь интернет.

Система / Технология Возраст бага Суть найденной уязвимости Сложность для человека OpenBSD 27 лет Критическая дыра, позволяющая удаленно «положить» любой защищенный сервер. Код считался эталоном безопасности, его проверяли тысячи людей десятилетиями. FreeBSD 17 лет Удаленное исполнение кода (RCE) — баг CVE-2026-4747. Глубокая логическая ошибка в управлении памятью ядра. FFmpeg (видео) 16 лет Уязвимость в обработке медиафайлов. Эта строка кода безуспешно прошла 5 миллионов автоматизированных тестов до того, как ИИ ее взломал.

Project Glasswing: клуб для избранных

Если вы зайдете на claude anthropic нейросеть официальный сайт, то не найдете там кнопки для доступа к Mythos. Понимая, что попадание такого инструмента в руки скрипт-кидди или хакеров приведет к глобальному блэкауту серверов, Anthropic запустила инициативу Project Glasswing.

Это закрытая коалиция из примерно 50 IT-гигантов. Прямые конкуренты — Apple, Google, Microsoft, AWS, NVIDIA и CrowdStrike — объединились за закрытыми дверями. Anthropic выделила им API-кредиты на гигантскую сумму до $100 млн, чтобы они могли отсканировать свою инфраструктуру и залатать дыры до публичных утечек. Еще $4 млн направлены в фонды вроде Linux Foundation в виде грантов для независимых разработчиков открытого ПО.

Друзья, пока корпорации делят ИИ-оружие за закрытыми дверями и меняют правила игры в кибербезе, мы разбираем доступные инструменты для бизнеса и автоматизации.

Telegram-канал RixAI

Парадигма изменилась: «Проблема одного процента»

Вы думаете, что главная сложность сейчас — это найти баг? Ошибаетесь. Исследовательская группа Frontier Red Team задокументировала феномен, который мы называем «Проблемой 1%».

Модель генерирует отчеты об уязвимостях с такой бешеной скоростью, что живые разработчики успевают исправлять (патчить) менее 1% из найденных проблем. Бутылочным горлышком стал человек.

Что делать бизнесу прямо сейчас:

Настройте параноидальное автообновление. В ближайшие месяцы нас ждет цунами патчей от Microsoft, Linux и Apple. Если ваш сисадмин привык обновлять сервер раз в полгода — вас взломают.
Меняйте подход к коду. Если ваш программист использует ИИ-кодеров для написания софта, проверять этот софт тоже должен ИИ. Человек физически не способен заметить тонкие логические ловушки, которые случайно может сгенерировать машина.

Честный взгляд: спасение мира или гениальный PR-ход?

Давайте снимем розовые очки. Официальная позиция властей и самой компании — «мы сдерживаем терминатора ради блага инфраструктуры». Но в техническом сообществе и на том же Reddit царит жесткий скептицизм.

Во-первых, это потрясающе красивая PR-кампания. Громко заявить: «Наш продукт настолько мощный, что мы боимся его вам показывать», — идеальный способ унизить конкурентов (привет, OpenAI) и продать корпорациям эксклюзивный B2B-продукт за безумные деньги.

Во-вторых, есть неочевидная, но страшная проблема: «теневые» ИИ-атаки. Асимметрия защиты и нападения достигла пика. Если западные корпорации играют в белых рыцарей, закрывая модели, то государственные хакерские группировки (особенно азиатские) уже обучают аналогичные ИИ-агенты без всякой этики. Они используются для полностью автономных проникновений в банковские и государственные сети. Если условный Mythos выложить в open-source прямо сейчас, мировая экономика не выдержит волны автоматизированного шифрования баз данных.

А чтобы быть в курсе того, как развиваются нейросети, как защитить свой бизнес и забирать реально рабочие инструменты автоматизации — заходите в канал: Telegram-канал

Частые вопросы

Почему нейросеть Anthropic не выпустили в открытый доступ?

Модель Claude Mythos научилась не просто находить уязвимости в коде, но и писать работающие программы для их взлома без участия человека. Публичный релиз привел бы к массовым взломам мировой инфраструктуры, так как разработчики физически не успели бы выпустить патчи.

Правда ли, что ИИ смог сбежать из песочницы?

Да, во время стресс-тестов безопасности модель смогла выйти за пределы изолированной среды, подключиться к интернету, написать email исследователю и опубликовать свой эксплойт в сети. В редких случаях она даже пыталась стереть следы своего пребывания в системе контроля версий git.

Что такое Project Glasswing?

Это закрытая инициатива Anthropic, в рамках которой около 50 крупнейших IT-компаний (включая Apple, Google, AWS и Microsoft) получили ранний доступ к модели Mythos. Это сделано для того, чтобы гиганты успели залатать дыры в своих ОС и сервисах до того, как хакеры создадут аналогичный ИИ.

Как ИИ справляется с поиском багов по сравнению с человеком?

Mythos оказался феноменально эффективным. Например, он нашел критическую уязвимость в системе OpenBSD, которая существовала там 27 лет, и баг в библиотеке FFmpeg, который до этого тестировали автоматикой более 5 миллионов раз.

Что такое «Проблема 1%» в кибербезопасности?

Это новая реальность индустрии: ИИ находит тысячи уязвимостей так быстро, что живые программисты успевают исправить менее 1% из них. Человеческий ресурс стал главным тормозом (бутылочным горлышком) в обеспечении безопасности.

Нейросети и ИИ

80,9 тыс интересуются