Как использовать Thinking Mode в Claude 4.5

4 января4 янв

4 мин

Thinking Mode (также называемый Extended Thinking, Thinking или Thinking Blocks) в Claude 4.5 — это явный и настраиваемый режим работы, который указывает модели использовать отдельно выделенный бюджет токенов для генерации внутреннего пошагового рассуждения (chain-of-thought) перед тем, как выдать финальный ответ. Этот режим предназначен для повышения качества: за счёт увеличения задержки и стоимости токенов в обмен на более глубокое внутреннее обдумывание. В Claude 4.5 данная возможность реализована на уровне Messages API с использованием явных параметров (например, thinking / budget_tokens). Также поддерживается сохранение Thinking Blocks, их опциональное шифрование (для последующей верификации или использования инструментами), а также новые механизмы кэширования и учёта токенов, которые необходимо учитывать при построении продакшн-нагрузок. Claude 4.5 — это последнее поколение моделей Claude от Anthropic, выпущенное в виде инкрементальных обновлений серии «4.5» (например, Sonnet 4.

Оглавление

Как использовать Thinking Mode в Claude 4.5
Что такое Claude 4.5? (И какие модели важны)
Производительность и бенчмарки (SWE-bench Verified)

Как использовать Thinking Mode в Claude 4.5

Thinking Mode (также называемый Extended Thinking, Thinking или Thinking Blocks) в Claude 4.5 — это явный и настраиваемый режим работы, который указывает модели использовать отдельно выделенный бюджет токенов для генерации внутреннего пошагового рассуждения (chain-of-thought) перед тем, как выдать финальный ответ.

Этот режим предназначен для повышения качества:

многошаговых рассуждений
сложного программирования
агентных рабочих процессов
исследовательских и аналитических задач

за счёт увеличения задержки и стоимости токенов в обмен на более глубокое внутреннее обдумывание.

В Claude 4.5 данная возможность реализована на уровне Messages API с использованием явных параметров (например, thinking / budget_tokens). Также поддерживается сохранение Thinking Blocks, их опциональное шифрование (для последующей верификации или использования инструментами), а также новые механизмы кэширования и учёта токенов, которые необходимо учитывать при построении продакшн-нагрузок.

Что такое Claude 4.5? (И какие модели важны)

Claude 4.5 — это последнее поколение моделей Claude от Anthropic, выпущенное в виде инкрементальных обновлений серии «4.5» (например, Sonnet 4.5 и Opus 4.5).

Claude Sonnet 4.5

Оптимальный баланс интеллекта, скорости, возможностей кодинга и агентной работы. Рекомендуется для большинства разработчиков.
Claude Opus 4.5

Ориентирован на максимально глубокие рассуждения и сохраняет Thinking Blocks для улучшенной непрерывности в многошаговых и долгоживущих сессиях.

Обе модели поддерживают Extended Thinking, однако поведение (например, краткое или полное отображение размышлений) различается в зависимости от модели.

Производительность и бенчмарки (SWE-bench Verified)

Наиболее заметный прирост производительности Claude 4.5, особенно Sonnet 4.5, наблюдается в бенчмарке SWE-bench Verified, который измеряет способность ИИ решать реальные задачи из GitHub.

МодельSWE-bench VerifiedOSWorld (Computer Use)Claude 3.5 Sonnet49.0%42.2%Claude 4.1 Opus67.6%55.0%Claude 4.5 Sonnet (Thinking включён)77.2%61.4%GPT-5 (Medium Reasoning)65.0%52.0%

Эти результаты показывают, что Claude 4.5 значительно превосходит предыдущие модели не только в генерации кода, но и в способности ориентироваться во всей файловой системе и выполнять автономные задачи без участия человека.

Почему это важно

Кодинг и агенты

Sonnet 4.5 демонстрирует значительный прогресс в реальных программных задачах и долгосрочной разработке, что делает его естественным выбором для:

генерации кода
редактирования кода
автономных агентных потоков

Расширенное мышление и контекст

Модели семейства Claude 4.5 способны рассуждать с использованием огромных внутренних рабочих областей (десятки тысяч токенов и более), что радикально меняет подход к проектированию промптов, управлению бюджетами и взаимодействию с инструментами.

Что такое Thinking Mode в Claude 4.5

Thinking Mode (официальное название — Extended Thinking) позволяет модели «показать свою работу самой себе» перед выдачей финального ответа.

В отличие от стандартного режима, Claude 4.5:

рассматривает несколько гипотез
выявляет логические ошибки
уточняет стратегию решения

используя специальное пространство рассуждений, прежде чем сформировать окончательный ответ.

Структура ответа

В режиме Thinking Mode ответ разделяется на два отдельных блока:

Тип блокаВидимостьНазначениеThinking BlockСкрыт (API) / свернут (UI)Внутренние рассуждения, планирование, самокритикаText BlockВидимФинальный ответ пользователю

Ключевые свойства Thinking Mode

Включается по запросу

Вы передаёте объект thinking в API-вызове:
{"type":"enabled","budget_tokens":10000}
Управление бюджетом

budget_tokens ограничивает количество токенов, используемых для внутреннего рассуждения.
Сокращение и редактирование

Размышления могут возвращаться в сокращённом виде или как redacted_thinking. В Claude 4 thinking-токены тарифицируются даже если пользователю возвращается только краткое резюме.
Подписи и верификация

Thinking Blocks содержат непрозрачную криптографическую подпись, используемую для проверки при повторной передаче в API. Не следует пытаться интерпретировать или изменять эту подпись.
Чередование размышлений и инструментов

Claude 4 поддерживает Interleaved Thinking — чередование рассуждений и вызовов инструментов, что особенно полезно для агентных сценариев.

Как Messages API возвращает Thinking-контент

Краткое и полное мышление, шифрование и подписи

Современные модели Claude 4 (например, Sonnet 4.5 и Opus 4.5) часто возвращают публичное краткое резюме рассуждений, тогда как полный внутренний scratchpad может быть зашифрован и доступен только через поле подписи или как redacted_thinking.

Если используются инструменты или требуется сохранить внутреннее состояние между шагами, Thinking Blocks или подпись необходимо передавать обратно в API.

Практический паттерн работы

Использование инструментов / продолжение рассуждений

Если следующий запрос должен продолжать то же внутреннее состояние, включите возвращённый Thinking Block или подпись в следующий API-вызов.

⭐ CometAPI и Claude 4.5 (ВАЖНО)

CometAPI предоставляет доступ к моделям Claude 4.5 по цене примерно на 20% ниже официальной, при этом полностью поддерживает Anthropic Messages API.

Поддерживаемые модели через CometAPI:

Claude Sonnet 4.5
Claude Opus 4.5
Claude Haiku 4.5

Перед началом работы необходимо войти в CometAPI и получить API-ключ.

Заключение

Claude 4.5 в сочетании с Extended Thinking, CLI Claude Code и выгодным доступом через CometAPI представляет собой крупнейший скачок в продуктивности разработчиков со времён появления IDE.

Освоение Thinking Mode — это обязательный навык в эпоху агентных систем. Он обеспечивает необходимую глубину рассуждений и прозрачность, требуемые для создания надёжных и масштабируемых ИИ-решений.