Как использовать Thinking Mode в Claude 4.5
Thinking Mode (также называемый Extended Thinking, Thinking или Thinking Blocks) в Claude 4.5 — это явный и настраиваемый режим работы, который указывает модели использовать отдельно выделенный бюджет токенов для генерации внутреннего пошагового рассуждения (chain-of-thought) перед тем, как выдать финальный ответ.
Этот режим предназначен для повышения качества:
- многошаговых рассуждений
- сложного программирования
- агентных рабочих процессов
- исследовательских и аналитических задач
за счёт увеличения задержки и стоимости токенов в обмен на более глубокое внутреннее обдумывание.
В Claude 4.5 данная возможность реализована на уровне Messages API с использованием явных параметров (например, thinking / budget_tokens). Также поддерживается сохранение Thinking Blocks, их опциональное шифрование (для последующей верификации или использования инструментами), а также новые механизмы кэширования и учёта токенов, которые необходимо учитывать при построении продакшн-нагрузок.
Что такое Claude 4.5? (И какие модели важны)
Claude 4.5 — это последнее поколение моделей Claude от Anthropic, выпущенное в виде инкрементальных обновлений серии «4.5» (например, Sonnet 4.5 и Opus 4.5).
- Claude Sonnet 4.5
Оптимальный баланс интеллекта, скорости, возможностей кодинга и агентной работы. Рекомендуется для большинства разработчиков. - Claude Opus 4.5
Ориентирован на максимально глубокие рассуждения и сохраняет Thinking Blocks для улучшенной непрерывности в многошаговых и долгоживущих сессиях.
Обе модели поддерживают Extended Thinking, однако поведение (например, краткое или полное отображение размышлений) различается в зависимости от модели.
Производительность и бенчмарки (SWE-bench Verified)
Наиболее заметный прирост производительности Claude 4.5, особенно Sonnet 4.5, наблюдается в бенчмарке SWE-bench Verified, который измеряет способность ИИ решать реальные задачи из GitHub.
МодельSWE-bench VerifiedOSWorld (Computer Use)Claude 3.5 Sonnet49.0%42.2%Claude 4.1 Opus67.6%55.0%Claude 4.5 Sonnet (Thinking включён)77.2%61.4%GPT-5 (Medium Reasoning)65.0%52.0%
Эти результаты показывают, что Claude 4.5 значительно превосходит предыдущие модели не только в генерации кода, но и в способности ориентироваться во всей файловой системе и выполнять автономные задачи без участия человека.
Почему это важно
Кодинг и агенты
Sonnet 4.5 демонстрирует значительный прогресс в реальных программных задачах и долгосрочной разработке, что делает его естественным выбором для:
- генерации кода
- редактирования кода
- автономных агентных потоков
Расширенное мышление и контекст
Модели семейства Claude 4.5 способны рассуждать с использованием огромных внутренних рабочих областей (десятки тысяч токенов и более), что радикально меняет подход к проектированию промптов, управлению бюджетами и взаимодействию с инструментами.
Что такое Thinking Mode в Claude 4.5
Thinking Mode (официальное название — Extended Thinking) позволяет модели «показать свою работу самой себе» перед выдачей финального ответа.
В отличие от стандартного режима, Claude 4.5:
- рассматривает несколько гипотез
- выявляет логические ошибки
- уточняет стратегию решения
используя специальное пространство рассуждений, прежде чем сформировать окончательный ответ.
Структура ответа
В режиме Thinking Mode ответ разделяется на два отдельных блока:
Тип блокаВидимостьНазначениеThinking BlockСкрыт (API) / свернут (UI)Внутренние рассуждения, планирование, самокритикаText BlockВидимФинальный ответ пользователю
Ключевые свойства Thinking Mode
- Включается по запросу
Вы передаёте объект thinking в API-вызове:
{"type":"enabled","budget_tokens":10000} - Управление бюджетом
budget_tokens ограничивает количество токенов, используемых для внутреннего рассуждения. - Сокращение и редактирование
Размышления могут возвращаться в сокращённом виде или как redacted_thinking. В Claude 4 thinking-токены тарифицируются даже если пользователю возвращается только краткое резюме. - Подписи и верификация
Thinking Blocks содержат непрозрачную криптографическую подпись, используемую для проверки при повторной передаче в API. Не следует пытаться интерпретировать или изменять эту подпись. - Чередование размышлений и инструментов
Claude 4 поддерживает Interleaved Thinking — чередование рассуждений и вызовов инструментов, что особенно полезно для агентных сценариев.
Как Messages API возвращает Thinking-контент
Краткое и полное мышление, шифрование и подписи
Современные модели Claude 4 (например, Sonnet 4.5 и Opus 4.5) часто возвращают публичное краткое резюме рассуждений, тогда как полный внутренний scratchpad может быть зашифрован и доступен только через поле подписи или как redacted_thinking.
Если используются инструменты или требуется сохранить внутреннее состояние между шагами, Thinking Blocks или подпись необходимо передавать обратно в API.
Практический паттерн работы
- Использование инструментов / продолжение рассуждений
Если следующий запрос должен продолжать то же внутреннее состояние, включите возвращённый Thinking Block или подпись в следующий API-вызов.
⭐ CometAPI и Claude 4.5 (ВАЖНО)
CometAPI предоставляет доступ к моделям Claude 4.5 по цене примерно на 20% ниже официальной, при этом полностью поддерживает Anthropic Messages API.
Поддерживаемые модели через CometAPI:
- Claude Sonnet 4.5
- Claude Opus 4.5
- Claude Haiku 4.5
Перед началом работы необходимо войти в CometAPI и получить API-ключ.
Заключение
Claude 4.5 в сочетании с Extended Thinking, CLI Claude Code и выгодным доступом через CometAPI представляет собой крупнейший скачок в продуктивности разработчиков со времён появления IDE.
Освоение Thinking Mode — это обязательный навык в эпоху агентных систем. Он обеспечивает необходимую глубину рассуждений и прозрачность, требуемые для создания надёжных и масштабируемых ИИ-решений.