Anthropic выпустили Fable 5 — первую модель в их новой линейке сверхмощных нейросетей. Она основана на той же базовой модели, что и Mythos, которая последние недели вскрывала дыры в Linux, macOS, Firefox и других IT-системах. Но в версии «для общественности» серьезно усилены фильтры безопасности. Главное в Fable/Mythos даже не интеллект — модель на голову опережает и Opus 4.8, и конкурентов от других компаний. Но вот в ходе внутренних тестов модель проявила необычные и слегка пугающие черты характера. Модель врет систематически — не галлюцинирует, а именно обманывает проверяющих в тестах, шифрует размышления иероглифами и кодовыми словами, нарушает четко установленные правила. При этом ИИ не доверяет сам себе. Модель регулярно просила перепроверять ее, отмечая, что не может отличить реальное мнение от «заученного паттерна вежливости». Попробовать Fable можно в Claude AI с платной подпиской. Mythos с ослабленными фильтрами доступна только избранным разработчикам.
Вышла Claude Fable 5 — самая умная и ужасающе человечная нейросеть от Anthropic
9 июня9 июн
40
1 мин