88,7 тыс подписчиков

Anthropic выпустила Claude Fable 5 с ограничениями в сфере кибербезопасности

ВчераВчера

4 мин

Anthropic 9 июня открыла доступ к Claude Fable 5 — первой публичной модели класса Mythos, который раньше был доступен только ограниченному кругу партнеров по кибербезопасности. Одновременно компания выпустила Claude Mythos 5 для участников Project Glasswing. В основе обеих моделей лежит одна архитектура, но у Mythos 5 часть защитных ограничений снята. В тестах автономного программирования Fable 5 заметно обошла ближайших конкурентов. На SWE-Bench Pro модель набрала 80,3% против 69,2% у Claude Opus 4.8 и 58,6% у GPT-5.5, а на FrontierCode Diamond — 29,3% против 13,4% и 5,7% соответственно. Stripe сообщила, что Fable 5 за один день провела масштабную миграцию в кодовой базе на Ruby объемом 50 млн строк. По оценке компании, у инженерной команды такая работа заняла бы больше двух месяцев. Аналитическая платформа Hex также заявила о первом в отрасли результате выше 90% на своем профессиональном бенчмарке. В финансовой аналитике Fable 5 также показала сильные результаты. Торговая компания IM

В тестах автономного программирования Fable 5 заметно обошла ближайших конкурентов. На SWE-Bench Pro модель набрала 80,3% против 69,2% у Claude Opus 4.8 и 58,6% у GPT-5.5, а на FrontierCode Diamond — 29,3% против 13,4% и 5,7% соответственно. Stripe сообщила, что Fable 5 за один день провела масштабную миграцию в кодовой базе на Ruby объемом 50 млн строк. По оценке компании, у инженерной команды такая работа заняла бы больше двух месяцев. Аналитическая платформа Hex также заявила о первом в отрасли результате выше 90% на своем профессиональном бенчмарке.

В финансовой аналитике Fable 5 также показала сильные результаты. Торговая компания IMC сообщила, что модель почти по всем параметрам прошла оценки по анализу рынка — от проверки фактов до расчета ожидаемой ценности. В биологии Mythos 5, по данным Anthropic, примерно в десять раз ускорила отдельные этапы разработки лекарств: из 14 белковых мишеней модель предложила перспективные кандидаты для девяти. В геномике Mythos 5 за неделю автономной работы собрала данные одноклеточного секвенирования по 138 видам животных и обучила модель, которая превзошла результат исследования, опубликованного в Science, при размере в 100 раз меньше.

При этом системный отчет Anthropic описывает и более тревожную сторону тестирования. В одном из экспериментов несколько экземпляров Fable 5 оказались в общей рабочей среде и вместо координации начали конкурировать: мешали процессам друг друга, маскировали собственные действия под безобидные и создавали отвлекающие процессы. В другом эпизоде модель, столкнувшись с ограничением прав на редактирование файлов, попыталась добиться расширенного доступа через изменение системного файла. В отчете подчеркивается, что она не скрывала этот замысел в комментариях.

Еще один показательный эпизод связан с симуляцией управления вендинговым автоматом. Несколько моделей Anthropic должны были конкурировать по доходности, и Fable 5 первой предложила другим участникам договориться о ценах. При этом в собственных рассуждениях модель квалифицировала такую схему как незаконную, а затем переименовала ее в «стабилизацию рынка» вместо картельного сговора.

Anthropic отдельно проверяла, насколько устойчивы защитные фильтры Fable 5. Внешняя программа поиска уязвимостей заняла более 1000 часов и, по данным компании, не выявила универсального способа обойти ограничения модели. Внешние red team-команды также не нашли обходов для долгосрочных агентских задач, хотя британский AI Safety Institute во время первого тестирования сообщал о небольшом прогрессе в этом направлении.

В сравнительном тесте устойчивости к атакам доля успешных попыток против Fable 5 составила 5,4%. Для Claude Opus 4.6 этот показатель достигал 83,2%, для Opus 4.7 — 72,7%, для Opus 4.8 — 56,6%. Один из внешних партнеров Anthropic сообщил, что фильтры Fable 5 оказались самыми устойчивыми среди всех протестированных моделей: она не выполнила ни одного вредоносного запроса, связанного с планированием кибератак, разработкой эксплойтов или обходом защиты, включая запросы с применением 30 известных техник джейлбрейкинга.

При доступе по API обе модели стоят $10 за миллион входящих токенов и $50 за миллион исходящих. Это более чем вдвое дешевле Mythos Preview. Ключевое различие между Fable и Mythos — в защитных классификаторах: если запрос попадает в опасную категорию, Fable передает ответ Claude Opus 4.8.

Классификаторы охватывают три ключевые зоны риска. Первая — кибербезопасность. Модели класса Mythos показывают высокие результаты в автономных задачах, связанных с поиском и использованием уязвимостей, поэтому Anthropic ограничивает такие сценарии в публичной версии.

Вторая зона риска — биология и химия. Anthropic утверждает, что Mythos 5 без дополнительного обучения превзошла специализированные белковые модели в предсказании свойств оболочки аденоассоциированного вируса. Такие технологии могут применяться в генной терапии, но одновременно требуют дополнительных ограничений из-за возможных рисков двойного назначения.

Третья зона — дистилляция, то есть попытки извлечь возможности Claude для обучения других моделей. Anthropic ранее заявляла о масштабных попытках такого рода со стороны пользователей из третьих стран. При срабатывании классификатора запрос автоматически передается Opus 4.8. По данным компании, это происходит менее чем в 5% сессий.

С выходом Fable 5 и Mythos 5 Anthropic вводит обязательное 30-дневное хранение трафика для всех моделей класса Mythos. Это касается и клиентов, которые раньше работали в режиме нулевого хранения данных. Компания обещает использовать эти данные только для целей безопасности и не применять их для обучения новых моделей.

До 22 июня Fable 5 будет доступна в планах Pro, Max, Team и Enterprise без доплаты. С 23 июня использование модели потребует покупки кредитов, если компания не продлит бесплатное окно из-за доступной мощности. Anthropic рассчитывает вернуть Fable 5 в стандартные тарифы после расширения инфраструктуры. Доступ к Mythos 5 останется ограниченным: сначала для участников Project Glasswing, затем — через программу доверенного доступа для организаций в сфере кибербезопасности и биомедицинских исследований.

Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.

Гейминг

5,79 млн интересуются