20 подписчиков

Claude Sonnet 5: Anthropic выпустила новую модель с упором на код

СегодняСегодня

2 мин

Anthropic объявила о выходе Claude Sonnet 5 — новой модели семейства Sonnet, которую компания называет самым «агентным» Sonnet на сегодняшний день. Главный акцент сделан не просто на генерации текста, а на способности модели планировать действия, использовать браузеры и терминалы, работать с инструментами и дольше выполнять задачи автономно. По словам Anthropic, уровень такой автономности ещё недавно был характерен для более крупных и дорогих моделей. Компания заявляет, что Sonnet 5 сокращает разрыв с Claude Opus 4.8, но при этом стоит дешевле. Также заявлены улучшения по сравнению с Sonnet 4.6 в рассуждениях, использовании инструментов, программировании и работе со знаниями. Поэтому запуск Claude Sonnet 5 выглядит не как косметическое обновление, а как попытка сделать агентные ИИ-задачи массовее и дешевле. Сразу после релиза Claude Sonnet 5 стала доступна во всех тарифных планах Claude. Для пользователей Free и Pro она назначена моделью по умолчанию. Пользователи Max, Team и Enterp

Anthropic объявила о выходе Claude Sonnet 5 — новой модели семейства Sonnet, которую компания называет самым «агентным» Sonnet на сегодняшний день.

Главный акцент сделан не просто на генерации текста, а на способности модели планировать действия, использовать браузеры и терминалы, работать с инструментами и дольше выполнять задачи автономно.

По словам Anthropic, уровень такой автономности ещё недавно был характерен для более крупных и дорогих моделей. Компания заявляет, что Sonnet 5 сокращает разрыв с Claude Opus 4.8, но при этом стоит дешевле.

Также заявлены улучшения по сравнению с Sonnet 4.6 в рассуждениях, использовании инструментов, программировании и работе со знаниями. Поэтому запуск Claude Sonnet 5 выглядит не как косметическое обновление, а как попытка сделать агентные ИИ-задачи массовее и дешевле.

Сразу после релиза Claude Sonnet 5 стала доступна во всех тарифных планах Claude. Для пользователей Free и Pro она назначена моделью по умолчанию. Пользователи Max, Team и Enterprise тоже получили к ней доступ. Разработчики могут использовать модель в Claude Code и на Claude Platform через API-идентификатор claude-sonnet-5.

До 31 августа 2026 года действует сниженная цена: 2 доллара за миллион входных токенов и 10 долларов за миллион выходных токенов. После этого стоимость вырастет до стандартного уровня: 3 доллара за миллион входных токенов и 15 долларов за миллион выходных токенов.

Anthropic отдельно отмечает, что у Sonnet 5 обновлён токенизатор, из-за чего один и тот же текст может занимать примерно в 1,0–1,35 раза больше токенов в зависимости от типа контента.

В задачах междисциплинарного рассуждения Humanity’s Last Exam Sonnet 5 тоже заметно обгоняет предшественницу. Без инструментов новая модель получила 43,2%, тогда как Sonnet 4.6 показала 34,6%. С инструментами разрыв сохраняется: 57,4% у Sonnet 5 против 46,8% у Sonnet 4.6. Opus 4.8 остаётся немного сильнее без инструментов с результатом 49,8% и почти на том же уровне с инструментами — 57,9%.

В компьютерном использовании OSWorld-Verified Claude Sonnet 5 набрала 81,2%, Sonnet 4.6 — 78,5%, а Opus 4.8 — 83,4%. В оценке knowledge work GDPval-AA v2 новая Sonnet получила 1618 баллов и даже слегка обошла Opus 4.8 с 1615 баллами, тогда как Sonnet 4.6 набрала 1395. На фоне этих цифр Sonnet 5 выглядит как модель, которая чаще приближается к уровню старшей линейки Opus, но сохраняет позиционирование более доступного решения.

Anthropic утверждает, что Sonnet 5 в целом показывает более низкую долю нежелательного поведения, чем Sonnet 4.6. В агентных сценариях модель лучше отказывает на вредоносные запросы и лучше сопротивляется попыткам prompt injection. Также компания сообщает о более низких уровнях галлюцинаций и поддакивания по сравнению с Sonnet 4.6.

При этом Anthropic честно указывает, что по автоматическому аудиту нежелательного поведения Sonnet 5 всё же уступает более сильным Opus 4.8 и Claude Mythos Preview. В сфере кибербезопасности компания не обучала Sonnet 5 специально на опасные cyber-задачи и заявляет, что её возможности там значительно ниже, чем у текущих Opus-моделей. В тесте на разработку эксплойтов для Firefox обе Sonnet-модели получили 0,0% по созданию полностью рабочего эксплойта, хотя у Sonnet 5 была чуть выше доля частичного успеха.

Claude Sonnet 5 можно назвать не просто очередной нейросетью, а важным шагом к более доступным ИИ-агентам для программирования, офисной работы и автоматизации.