59,6 тыс подписчиков

Fable 5: сверхразум на поводке

11 июня11 июн

556

4 мин

В индустрии ИИ за последние годы сложился устойчивый жанр, ежемесячный релиз модели с прибавкой 0.1 к номеру и дежурным обещанием революции. Публика к жанру привыкла и реагирует вяло. Однако есть событие, которое ломает стереотип, ведь речь о модели, которая успела наделать шуму еще до своего появления. Речь идет про Claude Fable 5, и здесь впервые компания прямо признала, изделие получилось настолько способным, что продавать его можно только с предохранителем. Предыстория начинается с Mythos. По итогам беста-тестирования оказалось, что LLM взламывает уязвимости нулевого дня как орех. За месяц были вскрыты дыры в серверах Linux о которых нкито не подозревал десятилетиями, а после посыпалась остальная защита. По сути, вся IT отрасль оказалсь в ситуации, когда любая система если она подключена к интернету оказалась под угрозой взлома. Поэтому в финальном релизе речь идет по сути о двух моделях - Mythos (тот самый взломщик для специалистов кибербезопасности) и Fable 5 (от латинского fabul

Однако есть событие, которое ломает стереотип, ведь речь о модели, которая успела наделать шуму еще до своего появления. Речь идет про Claude Fable 5, и здесь впервые компания прямо признала, изделие получилось настолько способным, что продавать его можно только с предохранителем.

Предыстория начинается с Mythos. По итогам беста-тестирования оказалось, что LLM взламывает уязвимости нулевого дня как орех. За месяц были вскрыты дыры в серверах Linux о которых нкито не подозревал десятилетиями, а после посыпалась остальная защита. По сути, вся IT отрасль оказалсь в ситуации, когда любая система если она подключена к интернету оказалась под угрозой взлома.

Поэтому в финальном релизе речь идет по сути о двух моделях - Mythos (тот самый взломщик для специалистов кибербезопасности) и Fable 5 (от латинского fabula, "то, что рассказано") - версия для всех желающих. Но в наморднике, решать задачи кибербеза, биологии, военной тематики она не будет. В этом случае вопрос перейдет к уже младшей модели Opus.

Теперь о возможностях, ибо они впечатляют. Stripe отчиталась, что модель за день перенесла кодовую базу в 50 млн строк - работа, на которую у целой команды ушло бы более двух месяцев. Биологи самой Anthropic ускорили отдельные этапы разработки лекарств примерно в десять раз, причем из 14 белковых мишеней девять дали сильных кандидатов в лекарства. А одна из выдвинутых моделью гипотез о белке кишечной палочки позднее подтвердилась независимой лабораторией, работавшей над той же задачей. Вот вам и ответ на вопрос – а может ли модель изобретать и быть по настоящему креативной. Ответ таков – теперь может.

Но главная особенность изделия относится к длительной автономной работе над задачей. Машина неделю трудится без присмотра человека, ведет собственные заметки и не теряет нить рассуждений на миллионах токенов, а чем длиннее задача, тем заметнее отрыв от предыдущего поколения. По сути, перед нами уже не чат-бот, а автономный научный сотрудник средней руки.

Отдельного слова заслуживают исследования самой Anthropic на версии без ограничителей. Mythos 5 за неделю практически самостоятельной работы провела полноценное исследование в геномике: собрала данные по миллионам клеток 138 видов животных, а затем спроектировала и обучила собственную нейросеть для поиска клеток с одинаковой функцией у дальних эволюционных родственников.

Итоговая модель обошла недавнюю публикацию в журнале Science, будучи при этом в сто раз меньше. В слепых сравнениях эксперты предпочитали научные гипотезы Mythos в молекулярной биологии в 80% случаев, а в задачах проектирования белков модель без помощи человека работала на уровне опытных специалистов, т.е. сама выбирала участки связывания, запускала инструменты и восстанавливалась после неудач.

Не обошлось и без курьезов. Модель прошла старую добрую Pokemon FireRed по сырой картинке с экрана, без карт и подсказок, тогда как прошлым поколениям для этого требовался целый набор костылей.

А теперь обещанная ложка дегтя. Запросы по кибербезопасности, биологии и химии перехватывает отдельный классификатор, и как мы ранее говорили, отвечает на них модель попроще - Opus 4.8.

Страховка срабатывает реже чем в 5% сессий, но ловит и вполне безобидные вопросы, что компания честно признает. Вдобавок весь трафик моделей этого класса теперь хранится 30 дней для отлова взломщиков, как уверяют в самом Anthropic. Намордник, между прочим, проверяли на прочность: за тысячу с лишним часов охоты за уязвимостями универсального способа обхода так и не нашли, впрочем это не значит, что его нет.

Экономика тоже любопытна. 10 и 50 долларов за миллион токенов на вход и выход вдвое дешевле предыдущей закрытой версии. Подписчикам модель выдали бесплатно, но лишь до 22 июня, дальше за отдельные кредиты, поэтому пользуем пока можем.

Вычислительных мощностей на всех желающих попросту не хватает, и это, пожалуй, главная примета времени. Контекст у запуска соответствующий: неделей ранее Microsoft представила собственные модели, дабы снизить зависимость от OpenAI, а GPT-5.5 и Gemini 3.5 толкаются на соседних строчках рейтингов. Счет в этой гонке идет уже не на годы, а на месяцы.

Что в итоге? Отрасль дозрела до состояния, когда передовой ИИ продают как изделие двойного назначения - с надзором государства, списками допущенных и обещанием расширять доступ по мере укрепления защиты.

Схема до боли напоминает экспортный контроль над ядерными технологиями, только цикл сжался с десятилетий до месяцев. Сами возможности уже мало кого удивляют.

Другая проблема кроется в том, что разработка LLM уже сегодня вышла из под какого-либо контроля и подобные автономные ИИ пусть и с задержкой в год, пять или даже десять обязательно выкататят на рынок другие игроки и времени дна адаптацию к такому будущему у нас уже практически нет