AI Security Institute протестировали Claude Mythos Preview в кибервозможность. Нейросеть провела пентсет корпоративной сети на уровне expert-level CTF. Ещё недавно на таких задачах модели буксовали почти безнадёжно, а теперь Mythos Preview берёт их с успехом 73%. AISI собрали сценарий из 32 шагов, от разведки до полного захвата корпоративной сети. Mythos Preview прошёл этот сценарий от начала до конца, причём успешно завершил его в 3 из 10 попыток и в среднем доходил до 22 шагов из 32. Следующий лучший результат у Claude Opus 4.6, который в среднем проходил 16 шагов. Модель уже не выглядит как «чатик, который что-то подсказывает». Она держит контекст, помнит, что уже пробовала, и двигается дальше, как исполнитель. Это уже очень похоже на автономную атаку, где человек задаёт рамку, а модель делает основную работу. 🛡Не все так идеально Тесты проводились в упрощённой среде без активных защитников и без полноценного SOC. Поэтому AISI прямо не утверждает, что Mythos Preview взломает х