Добавить в корзинуПозвонить
Найти в Дзене

Как я сократил расход токенов в Claude Code в 4 раза

Anthropic признали: пользователи Claude Code Max сжигают месячный план за час. Комьюнити за неделю наплодило десяток инструментов - от мемных до инженерных. Рассказываю, что реально работает. 31 марта 2026 года Anthropic публично сказали: люди упираются в лимиты в разы быстрее, чем мы планировали. Средний разработчик тратит $6 в день, активный - $12. При плане в $200 это 16-33 рабочих дня. Звучит нормально, но на практике лимит часто выгорает за пару часов интенсивной работы. Почему? Claude Code работает в терминале. Он читает файлы, запускает команды, анализирует вывод. Каждый запуск git status, каждый прочитанный файл, каждый тест - это тысячи токенов на входе. А ты платишь за каждый. Самый вирусный инструмент. Заставляет Claude отвечать как пещерный человек: "Why use many token when few token do trick." Вместо 1 214 токенов на ответ - 294. Минус 65% на выходных токенах. Автор сам назвал это шуткой. Но 881 балл на Hacker News и освещение в СМИ говорят, что шутка зашла. Реальная экон
Оглавление

Anthropic признали: пользователи Claude Code Max сжигают месячный план за час. Комьюнити за неделю наплодило десяток инструментов - от мемных до инженерных. Рассказываю, что реально работает.

Проблема: $200 в месяц - и всё равно мало

31 марта 2026 года Anthropic публично сказали: люди упираются в лимиты в разы быстрее, чем мы планировали. Средний разработчик тратит $6 в день, активный - $12. При плане в $200 это 16-33 рабочих дня. Звучит нормально, но на практике лимит часто выгорает за пару часов интенсивной работы.

Почему? Claude Code работает в терминале. Он читает файлы, запускает команды, анализирует вывод. Каждый запуск git status, каждый прочитанный файл, каждый тест - это тысячи токенов на входе. А ты платишь за каждый.

Caveman Mode - 6 400 звёзд за 4 дня

Самый вирусный инструмент. Заставляет Claude отвечать как пещерный человек: "Why use many token when few token do trick."

Вместо 1 214 токенов на ответ - 294. Минус 65% на выходных токенах. Автор сам назвал это шуткой. Но 881 балл на Hacker News и освещение в СМИ говорят, что шутка зашла.

Реальная экономия на общих затратах - около 25%. Почему не 65%? Потому что основной расход - входные токены (контекст), а не выходные.

RTK - Rust Token Killer

А вот это уже серьёзно. 19 900 звёзд на GitHub.

RTK - маленький бинарник на Rust, который встаёт между Claude и терминалом. Перехватывает вывод команд и сжимает его до того, как он попадёт в контекст.

Цифры из бенчмарка за 30 минут работы:

  • ls и tree: минус 80%
  • Чтение файлов: минус 70%
  • Вывод тестов: минус 90%
  • Git-операции: минус 80-92%
  • Итого: 118 000 токенов сжались до 23 900

Это работает, потому что давит на input-токены - главную статью расходов.

/compact - бесплатно и уже встроено

Встроенная команда Claude Code. Автокомпакт срабатывает на 95% контекста - слишком поздно. Запускай вручную на 60% и указывай, что сохранить.

Одна команда. Минус 30-50% контекста за сессию. Это первое, что стоит попробовать.

Model routing - дорогая модель не для всего

Не каждая задача требует Opus. Поиск файлов, чтение доков, проверка типов - всё это может делать Haiku за $0.25 вместо $3.75 за миллион токенов.

Настраивается одной переменной: CLAUDE_CODE_SUBAGENT_MODEL=haiku. Экономия до 92% на субагентах.

Паттерн простой: Opus думает, Haiku бегает.

Thinking budget - скрытый расход

По умолчанию Claude тратит 32 000 токенов на "размышления" перед ответом. Тарифицируются как output - самые дорогие. Большинству задач хватает 8 000.

Установи MAX_THINKING_TOKENS=8000 или используй /effort. Минус 70% на скрытых затратах, которые ты даже не видишь.

Что выбрать из всего этого

Если ты только начинаешь оптимизировать, бери три вещи:

  1. /compact на 60% - бесплатно, работает сразу
  2. RTK - максимальная экономия на входных токенах
  3. Model routing - официальный способ снизить стоимость

Caveman Mode - отличный мем и приятный бонус. Но основные деньги утекают через вход, а не через выход.

А ты следишь за расходом токенов или пока не задумывался?