Большинство людей, которые начинают работать с Claude Code агентами, совершают одну и ту же ошибку: думают, что чем больше контекста - тем лучше работает агент. Это полуправда (хотя на самом деле - почти полная неправда). Реальность в 2026 году такова: контекст - ваш главный ресурс и главный враг одновременно. В этой статье разберём, как перейти от хаотичного вайб-кодинга к рабочей системе агентов на Claude Code, которая не ломается на третий день.
Что узнаете:
- Как работает фреймворк "plan - build - verify - evolve" и почему без него больно
- Что такое "тупая зона" и при чём тут 1 млн токенов
- Почему промпты не защищают, а хуки - защищают (история с email-катастрофой)
- Как устроена архитектура harness + AI-слой и что такое Ralph Loop
- И главное: почему каждый баг в системе - это подарок, а не провал - и где этому можно учиться дальше
Harness и AI-слой: два уровня, которые путают чаще всего
Прежде чем говорить про агентов, нужно разобраться с базовой архитектурой.
Claude Code - это не просто чат с моделью. Это harness, то есть обёртка вокруг языковой модели, которая управляет инструментами, памятью и потоком задач. Думайте об этом как об операционной системе: модель - процессор, harness - всё остальное.
Поверх harness есть AI-слой - то, что вы настраиваете сами. Он состоит из трёх компонентов:
- CLAUDE.md - системные инструкции, которые грузятся при старте каждой сессии
- Скиллы - переиспользуемые блоки поведения (важно: тело скилла загружается только при вызове, не при старте - это экономит контекст)
- Хуки - перехватчики, которые срабатывают на действия агента
Антропик официально описал 7 способов управлять поведением Claude Code: CLAUDE.md файлы, rules, skills, subagents, hooks, output styles и appending system prompt. На практике 80% результата даёт грамотная работа с первыми тремя.
Фреймворк 4 шагов: plan, build, verify, evolve
Это не метафора. Это буквально структура работы с агентами в Claude Code.
Plan. Сначала - исследование и планирование, отдельно от выполнения. У Claude Code есть специальный plan mode, который разделяет эти фазы. Официальная рекомендация Anthropic: "Explore first, then plan, then code". Казалось бы, очевидно. На деле 90% людей сразу пишут "сделай мне X" и потом удивляются результату.
Build. Выполнение с чётко сформулированным контекстом. Именно здесь важна минимальность - не "дай агенту всё", а "дай агенту ровно то, что нужно для этой задачи". Борис Черны (создатель Claude Code) описывает прогрессию за два года: от prompt engineering к context engineering и сейчас к context minimalism. Минимальный системный промпт, минимум инструментов, и путь для Claude - самому тянуть нужный контекст по мере необходимости.
Verify. Без верификации качество с первого прохода около 65-70%. С встроенной верификацией - около 92%. Разница в 22-27% - это не мелочь, это разница между "работает" и "работает надёжно".
Evolve. Каждый баг или сбой - это сигнал к обновлению правил в CLAUDE.md или хуках. Система становится надёжнее через инциденты. Вернее даже не "умнее", а "надёжнее" - что в production важнее.
Кстати, если тема интересна - в Telegram-канале пишу о подобном регулярно: инструменты, лайфхаки, конкретные сценарии использования нейросетей в жизни и бизнесе. Там проще задать вопрос и не ждать следующей статьи.
Контекст: почему 1 млн токенов - ложная безопасность
Вот тот самый контринтуитивный момент, к которому я обещал вернуться в начале.
У Claude есть огромное контекстное окно - это технически правда. Но официальная документация Claude Code прямо предупреждает: производительность деградирует по мере заполнения. Это называется "тупая зона". У Opus 4.8 она начинается примерно на 250 тыс. токенов, у Sonnet 4.6 - около 100-125 тыс. После этого порога агент начинает делать ошибки, которые в свежем контексте просто не делал.
Что с этим делать практически:
- Auto-compaction срабатывает на ~83.5% заполненности, но эксперты рекомендуют делать /compact раньше - на 70-75%
- Команда /compact принимает инструкции по суммированию: вы контролируете, что войдёт в сжатую версию, а что можно выбросить
- Фича Tool Search (ENABLE_TOOL_SEARCH=auto:5) снижает потребление контекста MCP-серверами примерно на 47%
- Оперативное правило из практики: два подряд сбоя = /clear и начать заново
Для управления состоянием между сессиями - три файла: plan.md (согласованный план), context.md (текущий прогресс и решения), tasks.md (чеклист). Простое решение, которое реально работает.
Безопасность: хуки vs промпты
Расскажу случай, который я использую как учебный пример при любом разговоре про агентов.
У одного крупного AI-блогера с 800K подписчиков агент неверно прочитал задачу из task list и разослал скидочный код всей email-базе. Не десяти тестовым адресам. Всей базе. Это случилось по одной причине: агент мог отправлять email, и никто технически не ограничил эту возможность. Промпт типа "отправляй письма только с разрешения" - не защита. Это пожелание.
Защита - это хуки типа PreToolUse. Они перехватывают любой вызов инструмента и могут его заблокировать через exit code 2. Это единственный надёжный способ принудительной защиты.
Вывод: чем выше ставки действия (отправить письмо, удалить файлы, запустить деплой), тем обязательнее хук вместо промпта.
Архитектура: субагенты и Ralph Loop
Субагенты в системе Claude Code агентов работают в изолированных контекстных окнах. В основную сессию возвращается только финальный результат - не весь процесс, не промежуточные шаги. Это и плюс (чистый основной контекст), и минус (нет прозрачности по умолчанию).
Популярный паттерн для сложных проектов - Ralph Loop: один агент читает спецификацию, пишет план по фазам. Каждую фазу выполняет отдельная сессия с handoff-документом. Это позволяет работать с большими задачами, не упираясь в деградацию контекста.
Ну, то есть, это не магия - просто грамотное управление состоянием через файлы вместо попытки удержать всё в одном окне.
Где Claude Code агенты чаще всего ломаются
Нет верификации. Запустили агента, он отчитался "готово" - вы поверили. Встраивайте проверку в сам процесс, не после него.
Слишком широкие права. Агент может всё, что может инструмент. История с email-рассылкой - не исключение, это норма для незащищённых систем. Ограничивайте права до минимально необходимых.
Переполненный контекст без контроля. Сессия идёт несколько часов, контекст забит, агент начинает делать странные ошибки. Два сбоя подряд - признак, что пора делать /clear.
Нет файлов состояния. После паузы или краша агент не знает, где остановился. Без context.md и tasks.md каждый рестарт - с нуля.
Игнорирование инцидентов. Что-то пошло не так, быстро поправили руками и забыли. Правильно: починили руками И обновили правила в CLAUDE.md или добавили хук. Иначе баг вернётся.
Когда стоит разобраться в этом глубже
Если вы уже используете Claude Code для реальных задач и чувствуете, что система "ведёт себя непредсказуемо" - это сигнал. Не модель плохая, а архитектура не выстроена.
Разобраться глубже стоит, когда у вас есть хотя бы один агент в production и вы хотите понять не "как заставить работать", а "как сделать, чтобы не ломалось". Именно тогда Ralph Loop и хуки перестают быть абстракцией. Пара конкретных мест для старта - в самом конце статьи.
Если хочется не просто читать про AI, а реально его применять, у меня есть несколько мест, где это можно делать вместе.
Начать стоит с Telegram-канала. Это наш основной ресурс, где разбираем новые инструменты, кейсы автоматизации и приёмы, которые можно применить уже завтра.
Если зайдёт, залетайте в AI BASE. Это закрытое сообщество, где я делюсь личными наработками по автоматизации, вайб-кодингу и нейросетям.
А если хочется прямо сейчас сесть и попробовать руками, есть два бесплатных курса с нуля: по n8n для автоматизации без кода и по Claude Code для разработки в связке с AI.
Частые вопросы
Как работают агенты в Claude Code?
Агент в Claude Code - это модель плюс набор инструментов плюс контекст сессии. Модель принимает решения, инструменты выполняют действия (читают файлы, запускают команды, обращаются к API). Harness управляет этим процессом, а вы управляете harness через CLAUDE.md, скиллы и хуки.
Как создать агента на Claude Code?
Минимально: написать CLAUDE.md с инструкциями и запустить сессию с чёткой задачей. Продвинуто: добавить скиллы для переиспользуемых блоков поведения, хуки для защиты критичных действий, и три файла состояния (plan.md, context.md, tasks.md) для работы между сессиями.
Что можно автоматизировать агентами Claude?
Практически любую задачу, которая требует чтения файлов, принятия решений и выполнения действий: рефакторинг кода, парсинг и обработка данных, генерация контента по шаблонам, тестирование, документирование. Чем выше риск действия (email, деплой, удаление), тем строже должна быть защита через хуки.
В чём отличие Claude Code агентов от обычных скриптов?
Скрипт выполняет заранее прописанную логику. Агент принимает решения в процессе: выбирает, какой инструмент вызвать, как интерпретировать результат, нужно ли уточнить задачу. Это даёт гибкость, но и ответственность: агент может принять неверное решение там, где скрипт просто упал бы с ошибкой.
Что такое intent engineering и зачем объяснять WHY?
Intent engineering - это принцип объяснять агенту не только что делать, но и зачем. Когда агент понимает цель, а не только инструкцию, он лучше справляется с краевыми случаями. "Отсортируй файлы" - инструкция. "Отсортируй файлы, чтобы было легче найти последние правки" - намерение. Anthropic официально рекомендует этот подход в документации к Opus 4.8.