Добавить в корзинуПозвонить
Найти в Дзене
PythonTalk

Пока все обсуждают новые рекорды Claude Sonnet 4.5 на бенчмарках (да, он теперь топ-1 по программированию на SWE-bench), стоит сделать

Пока все обсуждают новые рекорды Claude Sonnet 4.5 на бенчмарках (да, он теперь топ-1 по программированию на SWE-bench), стоит сделать акцент на другом. Выкатить просто более умную модель — это ожидаемо. Сегодня они, завтра — другие. Anthropic выкатили не просто модель, а целостную платформу для создания AI-агентов. Раньше нам давали "голый" движок (API модели), а всю обвязку — управление памятью, состоянием, разделение задач, интеграцию с инструментами — пили сам, как умеешь. Поэтому главный анонс — это Claude Agent SDK. По сути, это тот самый фреймворк, на котором построен их флагманский продукт Claude Code. Что это значит? 1. Прощай, велосипедостроение. Управление контекстом, памятью для долгоживущих задач, система разрешений, координация нескольких подагентов — все эти дико сложные инженерные задачи уже решены за нас. 2. Глубокая интеграция, а не просто чат в IDE. Нативный VS Code extension, чекпоинты (!!!) для отката состояния кода и диалога, фоновые задачи. 3. Да, Sonnet 4.

Пока все обсуждают новые рекорды Claude Sonnet 4.5 на бенчмарках (да, он теперь топ-1 по программированию на SWE-bench), стоит сделать акцент на другом. Выкатить просто более умную модель — это ожидаемо. Сегодня они, завтра — другие.

Anthropic выкатили не просто модель, а целостную платформу для создания AI-агентов.

Раньше нам давали "голый" движок (API модели), а всю обвязку — управление памятью, состоянием, разделение задач, интеграцию с инструментами — пили сам, как умеешь.

Поэтому главный анонс — это Claude Agent SDK. По сути, это тот самый фреймворк, на котором построен их флагманский продукт Claude Code.

Что это значит?

1. Прощай, велосипедостроение. Управление контекстом, памятью для долгоживущих задач, система разрешений, координация нескольких подагентов — все эти дико сложные инженерные задачи уже решены за нас.

2. Глубокая интеграция, а не просто чат в IDE. Нативный VS Code extension, чекпоинты (!!!) для отката состояния кода и диалога, фоновые задачи.

3. Да, Sonnet 4.5 хорош. Скачок с 42% до 61% на OSWorld (задачи по реальному использованию компьютера) — это сильный прирост. Но всё это раскрывается именно в связке с этой новой платформой.

Anthropic этим релизом делают заявку на лидерство именно в гонке платформ для разработчиков, а не просто в гонке попугаев-бенчмарков.

Ссылочки:

- Анонс Sonnet 4.5

- Технические подробности про автономность и Claude Code

-2