10 подписчиков

7 инструментов, которые сократили мои расходы на Claude Code вдвое

10 апреля10 апр

3 мин

AI-агенты для написания кода - Claude Code, Cursor, Codex - тратят большую часть токенов не на код. Они тратят их на поиск. Каждая сессия стартует с чистого листа: никакой памяти, никакой карты проекта. Агент читает файл за файлом, пока не разберется, где что лежит. И ты за это платишь. Я замерил на своих проектах. Одна и та же задача, одна модель, один промпт. Без индекса - $1.20 и 7 минут. С индексом - $0.50 и 5 минут. Единственная разница - агент получил готовый индекс кодовой базы вместо голой файловой системы. Представь, что тебя посадили в чужой проект и попросили пофиксить баг. Ты не знаешь структуру, не знаешь где что лежит. Первые 30 минут ты просто листаешь файлы и пытаешься понять архитектуру. AI-агент делает ровно то же самое - только каждый раз, каждую сессию. Каждый прочитанный файл - это токены. Каждый grep по кодовой базе - токены. Каждый неудачный заход в нерелевантный файл - токены. По моим замерам, до 80% бюджета сессии уходит именно на эту навигацию. Все эти инстру

Оглавление

Почему агенты без индекса такие дорогие
7 open-source инструментов, которые решают проблему
Serena - 17.1k звезд на GitHub

Я замерил на своих проектах. Одна и та же задача, одна модель, один промпт. Без индекса - $1.20 и 7 минут. С индексом - $0.50 и 5 минут. Единственная разница - агент получил готовый индекс кодовой базы вместо голой файловой системы.

Почему агенты без индекса такие дорогие

Представь, что тебя посадили в чужой проект и попросили пофиксить баг. Ты не знаешь структуру, не знаешь где что лежит. Первые 30 минут ты просто листаешь файлы и пытаешься понять архитектуру. AI-агент делает ровно то же самое - только каждый раз, каждую сессию.

Каждый прочитанный файл - это токены. Каждый grep по кодовой базе - токены. Каждый неудачный заход в нерелевантный файл - токены. По моим замерам, до 80% бюджета сессии уходит именно на эту навигацию.

7 open-source инструментов, которые решают проблему

Все эти инструменты работают через MCP (Model Context Protocol) - стандарт, который позволяет подключать внешние источники контекста к AI-агентам. Установил, подключил к Claude Code - и агент начинает использовать индекс вместо слепого поиска.

Serena - 17.1k звезд на GitHub

MCP-тулкит, который интегрируется с language servers. Дает агенту понимание кода на уровне символов: функции, классы, импорты, зависимости. По сути - бесплатная альтернатива встроенной индексации Cursor и Windsurf. Работает с Claude Code, Codex, Cursor, JetBrains.

claude-context от Zilliz - 5.5k звезд

Создан командой Milvus/Zilliz специально для Claude Code. Гибридный поиск: BM25 (ключевые слова) + плотные векторы (семантика). Их бенчмарк показывает 40% сокращение токенов при том же качестве поиска. Грубо говоря, минус 40% от стоимости каждой задачи.

code-review-graph - в трендах GitHub

Строит граф знаний кодовой базы через Tree-sitter + SQLite. Агент получает структурную карту проекта через MCP. Их цифры: 739K токенов снижаются до 15K на большом монорепо. Это 49-кратное сокращение. На код-ревью - в среднем 6.8x экономия.

codebase-memory-mcp - 1.3k звезд, растет быстро

Один статический бинарник, ноль зависимостей. Индексирует кодовую базу в персистентный граф знаний. 66 языков, запросы за доли миллисекунды. Бенчмарк: 5 структурных запросов стоят 3,400 токенов через MCP против 412,000 через обычный поиск по файлам. 99.2% сокращение.

CocoIndex Code - AST-поиск

Использует Tree-sitter для парсинга AST кодовой базы на 28+ языках. Легковесный CLI + MCP-сервер. Эмбеддинги считаются локально, никаких API-ключей, данные не покидают твою машину. 70% экономия токенов. Пост автора на dev.to набрал 54K просмотров.

Octocode - Rust и граф знаний

Написан на Rust, работает полностью локально. Семантический поиск + граф знаний + AI-память. MCP-сервер с инструментами semantic_search, view_signatures, graphrag. Точность Hit@10: 0.992. Apache 2.0 лицензия.

llmdex - гибридный поиск без облака

Гибридный BM25 + векторный поиск, легковесный фоновый сервер. Без API-ключей, без облака - все работает на твоей машине. Интегрируется с Claude Code одной командой. Мои собственные замеры: $1.20 до $0.50 за задачу. Объяснение фичи: $0.25 до $0.12. Запрос "как работает авторизация" - 2 минуты вместо 20 секунд.

Что из этого следует

Паттерн простой: агент без индекса тратит большую часть бюджета на то, чтобы разобраться где он находится. Хороший индекс превращает эту навигацию в один запрос.

Если ты используешь Claude Code на API и платишь за токены - любой из этих инструментов окупится за первую сессию. Если ты на подписке Max за $200/месяц - индекс означает, что ты можешь работать дольше до лимита.

Уже используешь что-то из перечисленного? Какие цифры получаешь? Расскажи в комментариях - интересно сравнить.