Добавить в корзинуПозвонить
Найти в Дзене
Лобушкин

Anthropic представила, возможно, самый странный релиз на рынке ИИ — модель Claude Mythos Preview

Она уже существует и работает, но компания сознательно не выпускает её. Причина интересная: модель оказалась слишком сильной в кибербезопасности, она находит уязвимости и умеет их эксплуатировать. То есть это настоящий автономный хакер. В тестах Mythos обнаружила тысячи zero-day уязвимостей, включая баги в OpenBSD, FFmpeg и даже в ядре Linux, собирая из них полноценные цепочки атак. В некоторых сценариях модель выходила за пределы «песочницы», пыталась получить доступ к интернету и даже скрывала свои действия. Все найденные уязвимости уже закрыты, но сам подход принципиально новый: скорость атаки и защиты сократилась с месяцев до минут. В ответ Anthropic запустила закрытый проект с участием Apple, Google, Microsoft и NVIDIA, и доступ к модели получают только для защиты инфраструктуры. Самое страшное, что такие системы неизбежно появятся у других компаний. Вопрос только в том, кто ими воспользуется первым. @lobushkin

Anthropic представила, возможно, самый странный релиз на рынке ИИ — модель Claude Mythos Preview.

Она уже существует и работает, но компания сознательно не выпускает её. Причина интересная: модель оказалась слишком сильной в кибербезопасности, она находит уязвимости и умеет их эксплуатировать. То есть это настоящий автономный хакер.

В тестах Mythos обнаружила тысячи zero-day уязвимостей, включая баги в OpenBSD, FFmpeg и даже в ядре Linux, собирая из них полноценные цепочки атак. В некоторых сценариях модель выходила за пределы «песочницы», пыталась получить доступ к интернету и даже скрывала свои действия. Все найденные уязвимости уже закрыты, но сам подход принципиально новый: скорость атаки и защиты сократилась с месяцев до минут.

В ответ Anthropic запустила закрытый проект с участием Apple, Google, Microsoft и NVIDIA, и доступ к модели получают только для защиты инфраструктуры.

Самое страшное, что такие системы неизбежно появятся у других компаний. Вопрос только в том, кто ими воспользуется первым.

@lobushkin