Ты пишешь "привет" своему AI-агенту. Он отвечает. Ты открываешь логи и видишь: 8 247 входных токенов. За приветствие. Первая реакция - должен быть баг. Я тоже сначала так думал. Бага нет. Это нормальная работа типового агента. Только "нормальной" её называет тот, кто не видел счёта за месяц. Разберу, куда уходят эти токены и как их вернуть. Что на самом деле съедает бюджет Представь библиотекаря, который к каждому читателю тащит на стойку весь справочный раздел. На всякий случай. Словари, энциклопедии, инструкции. Ровно так работает типовой AI-агент. В системный промпт запаковано всё: описания всех инструментов, все доменные правила, все роли. Модель "видит" эту кучу перед каждым ответом. Даже если пользователь спросил время. На моём первом агенте это было 60-80% всех входных токенов. Каждый вызов. Каждого пользователя. При миллионе запросов в месяц ты оплачиваешь не мышление модели - ты оплачиваешь её чтение собственной инструкции. Skills: описание сейчас, промпт потом Первое решение
8000 токенов за одно "привет": куда утекает бюджет
16 апреля16 апр
3
3 мин