Больше 4 месяцев я ежедневно работаю с автономными агентами - OpenClaw, Claude Code, Hermes.
Вывод: все агентные системы наследуют одни и те же хронические дефекты моделей. ChatGPT, Claude, Gemini, GLM - одни и те же 7 болезней.
Если вы ждете, что ИИ "все сделает как надо" - вот с чем столкнетесь. 1️⃣ Туннельное зрение - агент теряет важное в длинных документах
Точность ответов падает почти вдвое, когда контекст заполнен наполовину. Порог не плавный. Скорее обрыв. Переставляешь ту же инструкцию из середины промпта в начало, и агент начинает ее выполнять.
Проблема незаметна, пока ваш системный промпт не разрастается со временем.
Лечение: контекст-инжиниринг, иерархические промпты со ссылками на файлы вместо одного длинного документа. 2️⃣ Цифровая дислексия - числа и даты для модели остаются слепым пятном
Модель оперирует числами как текстом. Текущая дата для модели тоже не факт, а вероятность. Агент может решить, что сегодня вчера, или смешать данные из двух разных периодов.
Леч