2279 подписчиков

Anthropic выпустила более безопасную версию своей «слишком опасной» нейросети Mythos

9 июня9 июн

3 мин

Компания Anthropic выпустила модель Claude Fable 5, которая, по ее словам, имеет возможности, «превосходящие возможности любой модели, которую мы ранее делали общедоступной». — gizmodo.com Еще в апреле компания Anthropic объявила о создании новой модели ИИ под названием Mythos, обладающей беспрецедентной способностью находить уязвимости в системах кибербезопасности. Ссылаясь на риск попадания мощной новой модели в чужие руки, компания изначально воздержалась от ее публичного выпуска, лишь постепенно предоставляя доступ небольшой группе ранних тестировщиков в рамках проекта под кодовым названием Project Glasswing. Сегодня Mythos наконец-то дебютировала на публике — хотя и в значительно ослабленном виде. Во вторник Anthropic сообщила о выпуске новой модели под названием Claude Fable 5, которую в корпоративном блоге описали как «модель класса Mythos, адаптированную для безопасного общего использования». Возможности новой модели в таких задачах, как кодирование, работа с визуальными данным

Оглавление

Меры безопасности
Стоимость

Еще в апреле компания Anthropic объявила о создании новой модели ИИ под названием Mythos, обладающей беспрецедентной способностью находить уязвимости в системах кибербезопасности. Ссылаясь на риск попадания мощной новой модели в чужие руки, компания изначально воздержалась от ее публичного выпуска, лишь постепенно предоставляя доступ небольшой группе ранних тестировщиков в рамках проекта под кодовым названием Project Glasswing.

Сегодня Mythos наконец-то дебютировала на публике — хотя и в значительно ослабленном виде.

Во вторник Anthropic сообщила о выпуске новой модели под названием Claude Fable 5, которую в корпоративном блоге описали как «модель класса Mythos, адаптированную для безопасного общего использования». Возможности новой модели в таких задачах, как кодирование, работа с визуальными данными, использование инструментов, юридический анализ и научные исследования, «превосходят возможности любой модели, которую мы когда-либо делали общедоступной», — написала компания. (Это подразумевает, что самая мощная версия Mythos способна на большее, но пока не была признана пригодной для публичного доступа.) «Чем дольше и сложнее задача, тем больше Fable 5 опережает наши другие модели».

Компания также запустила еще одну модель под названием Mythos 5, которая обладает теми же возможностями, что и Fable 5, за исключением некоторых мер безопасности. Однако на данный момент эта модель доступна только узкому кругу организаций, участвующих в Project Glasswing, но Anthropic заявила, что скоро доступ будет расширен.

Меры безопасности

Fable 5 оснащена мерами безопасности, разработанными для того, чтобы модель не отвечала на вопросы по особо чувствительным темам, таким как кибербезопасность, биология и химия. В таких случаях она автоматически переключается на более раннюю модель Claude, Opus 4.8, чтобы избежать разглашения информации, которая могла бы, например, облегчить потенциальным террористам создание биологического оружия.

Anthropic заявляет, что провела тестирование новой общедоступной модели (red-teaming) как внутренне, так и в сотрудничестве с внешними экспертами, чтобы выявить уязвимости безопасности, которые могли бы привести к «джейлбрейкам» (взлому). (То есть к манипулированию чат-ботом ИИ с целью игнорирования и обхода встроенных мер безопасности).

И Fable 5, и Mythos 5 обучены действовать осторожно, отмечает Anthropic, что может привести к случаям, когда запросы пользователей, которые на самом деле безвредны, ошибочно помечаются моделью как опасные. «Поскольку мы отдали приоритет безопасности, мы намеренно настроили меры защиты так, чтобы они были излишне осторожными, и они все еще строже, чем хотелось бы в идеале», — говорится в сообщении блога компании. «Мы признаем, что это вызовет разочарование у некоторых пользователей, и наша цель — уменьшить количество ложных срабатываний по мере обновления и доработки мер безопасности после запуска». Opus 4.8 уже успела раздражать некоторых пользователей после того, как Anthropic повысила «честность» модели.

Стоимость

При высокой цене в 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов Fable 5 и Mythos 5 стоят вдвое дороже стандартной версии Opus 4.8. В то время как многие индивидуальные разработчики и организации начинают беспокоиться о затратах на использование ИИ, это, вероятно, выведет новую модель Anthropic за рамки бюджетов большей части ее пользовательской базы.

Однако не следует недооценивать мощную ауру, созданную вокруг Mythos за последние пару месяцев: многие люди, слышавшие слухи о легендарной Mythos, вероятно, будут более чем рады оплатить использование токенов просто для того, чтобы увидеть, оправдает ли Fable эти слухи.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Webb Wright

Оригинал статьи

Нейросети и ИИ

80,9 тыс интересуются