Добавить в корзинуПозвонить
Найти в Дзене

Куда уходят деньги твоего AI-агента: 6 инструментов, чтобы это выяснить

Твой AI-агент тратит деньги. Ты можешь сказать - на что? Не общий счет. А конкретно: какой вызов LLM стоил сколько, где агент зациклился, почему одна задача обошлась в $4, а такая же - в $0.50. Если не можешь - ты не одинок. Большинство команд видят инвойс, но не видят трейс. Две почти одинаковые задачи. Одна стоит $0.50, другая - $4. Восьмикратная разница. Без трейсинга ты этого не увидишь. Трейсинг - это когда записывается каждый вызов LLM, каждый запуск инструмента, каждый суб-агент. С точным количеством токенов и стоимостью на каждом шаге. Когда я посмотрел на трейс дорогого запуска, стало очевидно: агент сжигал 80% бюджета на навигацию по файлам. Не на работу. На поиск того, где вообще находится нужный код. Это как вести бизнес без бухгалтерии. Деньги уходят, а куда - загадка. Я экспортировал полный трейс и отправил его фронтирной модели - Claude Opus, GPT-4.1, любой самой мощной из доступных. Попросил проанализировать конфигурацию агента и найти, что можно оптимизировать. Снижен
Оглавление

Твой AI-агент тратит деньги. Ты можешь сказать - на что? Не общий счет. А конкретно: какой вызов LLM стоил сколько, где агент зациклился, почему одна задача обошлась в $4, а такая же - в $0.50. Если не можешь - ты не одинок. Большинство команд видят инвойс, но не видят трейс.

Как выглядит проблема изнутри

Две почти одинаковые задачи. Одна стоит $0.50, другая - $4. Восьмикратная разница.

Без трейсинга ты этого не увидишь. Трейсинг - это когда записывается каждый вызов LLM, каждый запуск инструмента, каждый суб-агент. С точным количеством токенов и стоимостью на каждом шаге.

Когда я посмотрел на трейс дорогого запуска, стало очевидно: агент сжигал 80% бюджета на навигацию по файлам. Не на работу. На поиск того, где вообще находится нужный код.

Это как вести бизнес без бухгалтерии. Деньги уходят, а куда - загадка.

Неожиданный фикс

Я экспортировал полный трейс и отправил его фронтирной модели - Claude Opus, GPT-4.1, любой самой мощной из доступных. Попросил проанализировать конфигурацию агента и найти, что можно оптимизировать.

Снижение стоимости на 60%. За одну итерацию. Трейс-данные сами подсказали решение.

6 open-source инструментов для observability агентов

Все бесплатные, все с открытым кодом. С реальными цифрами.

Langfuse - 24.8K звезд. YC W23. В январе 2026 куплен ClickHouse за $400M. OpenTelemetry-native трейсинг, эвалюации, управление промптами. 26 миллионов установок SDK в месяц.

Opik от Comet - 18.6K звезд. Трейсинг агентов, автоматические эвалюации, продакшен-дашборды. Есть встроенный Agent Optimizer - сам улучшает промпты.

TensorZero - 11.1K звезд. Написан на Rust. Gateway с латенси меньше 1 миллисекунды, observability, оптимизация, встроенное A/B тестирование. Привлекли $7.3M.

Arize Phoenix - 9.2K звезд. Обнаружение дрифта, кластеризация, эвалюации. Закрыли Series C на $70M - самый крупный раунд в AI observability. 2 миллиона скачиваний в месяц.

Laminar - 2.7K звезд. YC S24. Сделан специально для агентов. Трейсинг одной строкой кода для Vercel AI SDK, LangChain, OpenAI, Anthropic. Основатели из Palantir и AWS.

Microsoft Agent Governance Toolkit - вышел 2 апреля 2026. Первый тулкит, закрывающий все 10 рисков OWASP для агентного AI. 7 пакетов: Python, TypeScript, Rust, Go, .NET. MIT-лицензия.

Что я вижу на практике

Команды, которые добавляют трейсинг рано, снижают расходы на 40-60% за пару итераций. Остальные продолжают платить и гадать.

А у тебя как с observability для агентов - трейсишь или по логам разбираешься?