Когда контекст переваливает за 150-200 тысяч токенов, модель теряет фокус. Ответы короче, точность ниже, стоимость выше. Платишь больше за худший результат. Знакомо всем кто держал агента на задаче дольше часа. Я перепробовал несколько подходов. ✅Два работают стабильно. 🔆Первый: файл прогресса. В начале сессии создаётся простой текстовый чеклист. Агент туда пишет что сделано, где мы сейчас, куда двигаемся. Не лог, а страховка. Если контекст поплыл, открываешь файл и восстанавливаешь картину за секунды. Без перечитки всей истории. 🔆Второй: handoff prompt вместо компакта. Когда контекст подходит к критической отметке, я не жму /compact. Прошу агента сформировать handoff: какие файлы участвуют, что сделано, где находимся, какой следующий шаг. Получаю чистый промпт, открываю новую сессию, вставляю, работаю дальше с того же места. Почему не compact? После 10-12 компактов подряд агент формально помнит задачу, но качество деградирует. Компакт от компакта это как ксерокс с ксерокса
Агент тупит в середине работы? Скорее всего дело не в модели, а в контексте
1 июня1 июн
1 мин