Anthropic выпускает Claude Fable 5 — первую общедоступную модель класса Mythos. Модель имеет защитные механизмы, блокирующие ответы в областях высокого риска, таких как кибербезопасность и биология. — techcrunch.com
Во вторник ИИ-компания запустила Claude Fable 5 — первую общедоступную версию своей модели Mythos. Anthropic заявляет, что Fable 5 превосходно справляется с разработкой программного обеспечения, интеллектуальной работой и обработкой изображений, но имеет жесткие ограничения безопасности. В областях с высоким риском, таких как кибербезопасность, биология, химия и дистилляция, модель блокирует ответы и переключается на Claude Opus 4.8.
Запущенная в апреле в режиме предварительного просмотра, Mythos изначально была доступна лишь ограниченному числу партнеров из-за проблем с кибербезопасностью. На прошлой неделе Anthropic расширила доступ до сотен организаций в 15 странах, вновь сосредоточившись на организациях, управляющих критической инфраструктурой.
Теперь версия этой технологии доступна всем через API Claude от Anthropic и корпоративные тарифы с оплатой по мере использования. Доступ по подпискам будет открываться поэтапно: до 22 июня Fable 5 будет включена в тарифы Pro, Max, Team и корпоративные тарифы с оплатой за рабочее место без дополнительной платы. 23 июня Anthropic уберет Fable 5 из этих тарифов, требуя использования кредитов для дальнейшего использования, с планами восстановить ее как стандартную функцию подписки в кратчайшие сроки.
Anthropic также развертывает новую версию Mythos под названием Mythos 5 для организаций, которые уже получили одобрение на доступ к этой передовой модели.
Запуск Fable происходит на фоне подготовки Anthropic к выходу на публичные рынки, наряду с OpenAI и SpaceX Илона Маска. Это также следует за призывом ИИ-компании, настоятельно рекомендующим крупным мировым ИИ-лабораториям установить скоординированный тормоз для развития передового ИИ. Anthropic предупредила, что системы развиваются настолько быстро, что могут вскоре достичь рекурсивного самосовершенствования (RSI), автономно улучшая себя без вмешательства человека.
Опасаясь того, что модель класса Mythos может натворить в чужих руках, Anthropic заявляет, что провела стресс-тестирование своих классификаторов с помощью попыток джейлбрейка перед выпуском Fable 5.
«Внутренне мы провели внешнюю программу вознаграждения за ошибки, которая не выявила универсальных джейлбрейков за более чем 1000 часов тестирования. Затем мы работали с внешними организациями по краснокомандному тестированию, которые также не смогли найти универсальных джейлбрейков».
Тем не менее, новые атаки все еще возможны. В результате, с запуском Fable 5 и Mythos 5, Anthropic заявила, что потребует 30-дневного хранения всех данных трафика, даже если у предприятий ранее были соглашения о нулевом хранении. Anthropic заявила, что не будет использовать данные для обучения, а только для «защиты от сложных и новых атак, включая новые джейлбрейки» и «выявления и уменьшения ложных срабатываний». Эта политика может создать отраслевой прецедент, при котором доступ к все более мощным моделям сопровождается обязательными политиками хранения данных, представленными в качестве меры безопасности.
Для тех, кто продолжит использовать модель, не на каждый вопрос будет дан ответ Fable 5. Anthropic заявляет, что случаи, когда Fable вынуждена переключаться на Opus 4.8, редки, а ранние данные показывают, что по крайней мере 95% сеансов Fable работают полностью на ответах самой модели.
В стороннем тестировании аналитическая компания Hex заявила, что Fable стала первой, получившей 90% по их основному аналитическому бенчмарку сложных, длительных аналитических задач.
«На самые сложные вопросы она демонстрирует сильное суждение и внимание к нюансам», — отметила Hex.
Платформа для совместного кодирования Base44 отметила в своем заявлении, что Fable лучше справляется с «однократным созданием целых приложений» и обладает превосходным вызовом инструментов. Платформа для ИИ-рабочего пространства и агентов Genspark заявила, что Fable превзошла все остальные модели в их оценках и показала значительно лучшие результаты в таких задачах, как дизайн пользовательского интерфейса и кодирование игр.
Ценообразование как для Fable 5, так и для Mythos 5 составляет 10 долларов за миллион входных токенов и 50 долларов за миллион выходных токенов, что вдвое превышает цену Opus 4.8. Одна только эта цена может послужить сдерживающим фактором для широкого использования.
Многие предприятия все больше критикуют расходы на ИИ после того, как увидели счета или досрочно исчерпали свои годовые бюджеты на ИИ. Передовые модели, такие как Opus 4.8, могут усугубить эти проблемы благодаря расширенным возможностям рассуждения, которые могут разделить один запрос на несколько задач.
Anthropic заявила, что ожидает очень высокого и труднопредсказуемого спроса на Fable 5. И действительно, некоторые, как платформа вознаграждений за покупки Rakuten, могут считать, что выгода оправдывает цену.
«При максимальной нагрузке Fable анализирует и проверяет собственную работу», — заявила Rakuten. «Для нас это делает возможными высокоавтономные операции — дополнительное мышление окупается».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Rebecca Bellan