805 подписчиков

Вы переплачиваете за AI в 50 раз. Вот почему — и как это остановить

ВчераВчера

4 мин

Каждый раз, когда ваш AI-агент дёргает Claude или GPT, вы платите не только за полезную работу. Вы оплачиваете структурный мусор — заголовки, форматирование, повторяющиеся инструкции, описания сотен функций, которыми агент даже не воспользуется. Эта невидимая накрутка называется fluff tax, и она сжирает ваш бюджет незаметно, но методично.

Разработчик под ником aeromomo запилил решение, которое

Оглавление

Что не так с обычными AI-вызовами
Как работает Claw Compactor
Кому это реально нужно

Разработчик под ником aeromomo запилил решение, которое обещает урезать эти расходы на 98%. Проект называется Claw Compactor, вышел на GitHub буквально в феврале 2026-го, и уже называется The 98% Crusher в твиттере.

Что не так с обычными AI-вызовами

Когда ваш агент отправляет запрос к языковой модели, он пихает в контекст всё подряд. Полный каталог инструментов. Описания методов. Примеры. Инструкции. Форматирование. Вот типичный сценарий — вы хотите, чтобы агент проанализировал данные и создал отчёт. Простая задача.

Но вместо того чтобы передать минимум информации, система грузит 150 тысяч токенов: все 500 функций, их параметры, подсказки, форматы вывода. Агент использует три функции, а платите вы за полтыщи.

Anthropic провели эксперимент и показали, как через выполнение кода можно схлопнуть контекст со 150K до 2K токенов — это 98,7% экономии. Вместо того чтобы описывать каждый инструмент словами, просто дать агенту код и сказать: запусти. Никакого лишнего текста, никаких описаний — чистая логика.

Как работает Claw Compactor

Проект использует пятислойную компрессионную технику. Это не просто zip-архив для текста — это умная система, которая давит токены без потери данных. Lossless, как в музыке или картинках.

Фишка в том, что Claw Compactor работает в связке с OpenClaw и Bot777 — экосистемой личных AI-ассистентов. Он берёт ваш раздутый промпт, вырезает всё лишнее, оставляет только то, что реально нужно модели для работы, и отправляет компактный запрос.

Вот что происходит под капотом:

Убирает повторяющиеся инструкции и описания
Схлопывает структурные элементы (JSON, XML) в минимальную форму
Заменяет длинные текстовые описания функций на компактные токены
Использует кеширование для повторяющихся частей контекста
Динамически подгружает контекст только тогда, когда он нужен

Результат — вместо 150 тысяч токенов на запрос вы отправляете две. Вместо восьми секунов ожидания — полторы. Вместо $0,26 за запрос — центы.

Кому это реально нужно

Это не для всех. Если вы пишете промпты руками в ChatGPT раз в неделю — забейте. Но если вы разработчик AI-агентов, который гоняет сотни тысяч запросов через API, эта штука может спасти бюджет проекта.

Целевая аудитория — DevOps-инженеры и разработчики, которые строят автоматизацию на базе языковых моделей. Те, кто устал видеть счета за Claude API с четырьмя нулями в конце месяца.

Проект опенсорсный и бесплатный, но требует технических навыков. Нужно уметь в GitHub, Python, понимать архитектуру AI-агентов. Документация пока минимальная — это совсем свежий проект, буквально несколько дней назад появился.

В чём подвох

Проект сырой. Очень сырой. Автор выложил код и концепцию, но это не коробочное решение. Нет красивого интерфейса, нет подробных гайдов, нет саппорта. Вы берёте репозиторий, читаете код, интегрируете сами.

Если вы не готовы ковыряться в исходниках и дорабатывать под свои задачи — лучше подождать более зрелых решений. Или хотя бы пока кто-то из сообщества не напишет нормальную документацию.

Ещё момент — компрессия работает не везде одинаково. Если у вас задачи требуют полного контекста (например, анализ больших документов), агрессивное сжатие может съесть важные детали. Хотя автор обещает lossless-подход, на практике всегда есть нюансы.

Почему это может выстрелить

Потому что боль реальная. Разработчики платят дикие деньги за токены, большая часть которых идёт впустую. И пока крупные компании вроде OpenAI и Anthropic продают API по старой схеме, появляются инструменты, которые помогают обойти эту систему.

Claw Compactor вдохновлён прорывом Anthropic с их Skills-фичей, которая вышла в октябре 2025-го. Они показали, что можно радикально снизить потребление токенов через выполнение кода вместо текстовых описаний инструментов. Теперь это концепция доступна в опенсорсе.

Если проект наберёт коммьюнити, появится документация, кейсы, интеграции — он может стать стандартом де-факто для оптимизации AI-расходов. Особенно для стартапов и небольших команд, которые не могут позволить себе enterprise-решения.

Что делать прямо сейчас

Если вы early adopter и умеете в GitHub — идите на репозиторий aeromomo/claw-compactor, читайте код, пробуйте интегрировать. Вы будете одним из первых, кто освоит эту технологию, пока она не стала мейнстримом.

Если технические навыки не ваш конёк — просто держите проект на радаре. Подпишитесь на репозиторий, следите за обновлениями. Когда появится нормальная документация и примеры использования, можно будет подключиться.

И главное — начните считать, сколько вы реально тратите на токены. Разберите свои AI-вызовы на части: сколько идёт на данные, сколько на структуру, сколько на мусор. Может оказаться, что вы действительно переплачиваете в десятки раз.

А теперь вопрос к вам: вы считаете расходы на токены или просто платите счета, не глядя? И готовы ли переходить на сырые опенсорсные решения ради экономии — или ждёте, пока кто-то другой проверит всё на своей шкуре?

Claw Compactor на GitHub

💬 А вы согласны с этим мнением или у вас другой опыт? Делитесь в комментариях!

🔔 Жмите колокольчик на главной странице и подписывайтесь!