Vladimir Sukhov | Нейросети, профессии и доход

714 подписчиков

Как управлять Claude Code агентами: 4 шага от хаоса к системе

24 июня24 июн

7 мин

Большинство людей, которые начинают работать с Claude Code агентами, совершают одну и ту же ошибку: думают, что чем больше контекста - тем лучше работает агент. Это полуправда (хотя на самом деле - почти полная неправда). Реальность в 2026 году такова: контекст - ваш главный ресурс и главный враг одновременно. В этой статье разберём, как перейти от хаотичного вайб-кодинга к рабочей системе агентов на Claude Code, которая не ломается на третий день. Что узнаете: Прежде чем говорить про агентов, нужно разобраться с базовой архитектурой. Claude Code - это не просто чат с моделью. Это harness, то есть обёртка вокруг языковой модели, которая управляет инструментами, памятью и потоком задач. Думайте об этом как об операционной системе: модель - процессор, harness - всё остальное. Поверх harness есть AI-слой - то, что вы настраиваете сами. Он состоит из трёх компонентов: Антропик официально описал 7 способов управлять поведением Claude Code: CLAUDE.md файлы, rules, skills, subagents, hooks,

Оглавление

Harness и AI-слой: два уровня, которые путают чаще всего
Фреймворк 4 шагов: plan, build, verify, evolve
Контекст: почему 1 млн токенов - ложная безопасность

Что узнаете:

Как работает фреймворк "plan - build - verify - evolve" и почему без него больно
Что такое "тупая зона" и при чём тут 1 млн токенов
Почему промпты не защищают, а хуки - защищают (история с email-катастрофой)
Как устроена архитектура harness + AI-слой и что такое Ralph Loop
И главное: почему каждый баг в системе - это подарок, а не провал - и где этому можно учиться дальше

Harness и AI-слой: два уровня, которые путают чаще всего

Прежде чем говорить про агентов, нужно разобраться с базовой архитектурой.

Claude Code - это не просто чат с моделью. Это harness, то есть обёртка вокруг языковой модели, которая управляет инструментами, памятью и потоком задач. Думайте об этом как об операционной системе: модель - процессор, harness - всё остальное.

Поверх harness есть AI-слой - то, что вы настраиваете сами. Он состоит из трёх компонентов:

CLAUDE.md - системные инструкции, которые грузятся при старте каждой сессии
Скиллы - переиспользуемые блоки поведения (важно: тело скилла загружается только при вызове, не при старте - это экономит контекст)
Хуки - перехватчики, которые срабатывают на действия агента

Антропик официально описал 7 способов управлять поведением Claude Code: CLAUDE.md файлы, rules, skills, subagents, hooks, output styles и appending system prompt. На практике 80% результата даёт грамотная работа с первыми тремя.

Фреймворк 4 шагов: plan, build, verify, evolve

Это не метафора. Это буквально структура работы с агентами в Claude Code.

Plan. Сначала - исследование и планирование, отдельно от выполнения. У Claude Code есть специальный plan mode, который разделяет эти фазы. Официальная рекомендация Anthropic: "Explore first, then plan, then code". Казалось бы, очевидно. На деле 90% людей сразу пишут "сделай мне X" и потом удивляются результату.

Build. Выполнение с чётко сформулированным контекстом. Именно здесь важна минимальность - не "дай агенту всё", а "дай агенту ровно то, что нужно для этой задачи". Борис Черны (создатель Claude Code) описывает прогрессию за два года: от prompt engineering к context engineering и сейчас к context minimalism. Минимальный системный промпт, минимум инструментов, и путь для Claude - самому тянуть нужный контекст по мере необходимости.

Verify. Без верификации качество с первого прохода около 65-70%. С встроенной верификацией - около 92%. Разница в 22-27% - это не мелочь, это разница между "работает" и "работает надёжно".

Evolve. Каждый баг или сбой - это сигнал к обновлению правил в CLAUDE.md или хуках. Система становится надёжнее через инциденты. Вернее даже не "умнее", а "надёжнее" - что в production важнее.

Кстати, если тема интересна - в Telegram-канале пишу о подобном регулярно: инструменты, лайфхаки, конкретные сценарии использования нейросетей в жизни и бизнесе. Там проще задать вопрос и не ждать следующей статьи.

Контекст: почему 1 млн токенов - ложная безопасность

Вот тот самый контринтуитивный момент, к которому я обещал вернуться в начале.

У Claude есть огромное контекстное окно - это технически правда. Но официальная документация Claude Code прямо предупреждает: производительность деградирует по мере заполнения. Это называется "тупая зона". У Opus 4.8 она начинается примерно на 250 тыс. токенов, у Sonnet 4.6 - около 100-125 тыс. После этого порога агент начинает делать ошибки, которые в свежем контексте просто не делал.

Что с этим делать практически:

Auto-compaction срабатывает на ~83.5% заполненности, но эксперты рекомендуют делать /compact раньше - на 70-75%
Команда /compact принимает инструкции по суммированию: вы контролируете, что войдёт в сжатую версию, а что можно выбросить
Фича Tool Search (ENABLE_TOOL_SEARCH=auto:5) снижает потребление контекста MCP-серверами примерно на 47%
Оперативное правило из практики: два подряд сбоя = /clear и начать заново

Для управления состоянием между сессиями - три файла: plan.md (согласованный план), context.md (текущий прогресс и решения), tasks.md (чеклист). Простое решение, которое реально работает.

Безопасность: хуки vs промпты

Расскажу случай, который я использую как учебный пример при любом разговоре про агентов.

У одного крупного AI-блогера с 800K подписчиков агент неверно прочитал задачу из task list и разослал скидочный код всей email-базе. Не десяти тестовым адресам. Всей базе. Это случилось по одной причине: агент мог отправлять email, и никто технически не ограничил эту возможность. Промпт типа "отправляй письма только с разрешения" - не защита. Это пожелание.

Защита - это хуки типа PreToolUse. Они перехватывают любой вызов инструмента и могут его заблокировать через exit code 2. Это единственный надёжный способ принудительной защиты.

Вывод: чем выше ставки действия (отправить письмо, удалить файлы, запустить деплой), тем обязательнее хук вместо промпта.

Архитектура: субагенты и Ralph Loop

Субагенты в системе Claude Code агентов работают в изолированных контекстных окнах. В основную сессию возвращается только финальный результат - не весь процесс, не промежуточные шаги. Это и плюс (чистый основной контекст), и минус (нет прозрачности по умолчанию).

Популярный паттерн для сложных проектов - Ralph Loop: один агент читает спецификацию, пишет план по фазам. Каждую фазу выполняет отдельная сессия с handoff-документом. Это позволяет работать с большими задачами, не упираясь в деградацию контекста.

Ну, то есть, это не магия - просто грамотное управление состоянием через файлы вместо попытки удержать всё в одном окне.

Где Claude Code агенты чаще всего ломаются

Нет верификации. Запустили агента, он отчитался "готово" - вы поверили. Встраивайте проверку в сам процесс, не после него.

Слишком широкие права. Агент может всё, что может инструмент. История с email-рассылкой - не исключение, это норма для незащищённых систем. Ограничивайте права до минимально необходимых.

Переполненный контекст без контроля. Сессия идёт несколько часов, контекст забит, агент начинает делать странные ошибки. Два сбоя подряд - признак, что пора делать /clear.

Нет файлов состояния. После паузы или краша агент не знает, где остановился. Без context.md и tasks.md каждый рестарт - с нуля.

Игнорирование инцидентов. Что-то пошло не так, быстро поправили руками и забыли. Правильно: починили руками И обновили правила в CLAUDE.md или добавили хук. Иначе баг вернётся.

Когда стоит разобраться в этом глубже

Если вы уже используете Claude Code для реальных задач и чувствуете, что система "ведёт себя непредсказуемо" - это сигнал. Не модель плохая, а архитектура не выстроена.

Разобраться глубже стоит, когда у вас есть хотя бы один агент в production и вы хотите понять не "как заставить работать", а "как сделать, чтобы не ломалось". Именно тогда Ralph Loop и хуки перестают быть абстракцией. Пара конкретных мест для старта - в самом конце статьи.

Если хочется не просто читать про AI, а реально его применять, у меня есть несколько мест, где это можно делать вместе.

Начать стоит с Telegram-канала. Это наш основной ресурс, где разбираем новые инструменты, кейсы автоматизации и приёмы, которые можно применить уже завтра.

Если зайдёт, залетайте в AI BASE. Это закрытое сообщество, где я делюсь личными наработками по автоматизации, вайб-кодингу и нейросетям.

А если хочется прямо сейчас сесть и попробовать руками, есть два бесплатных курса с нуля: по n8n для автоматизации без кода и по Claude Code для разработки в связке с AI.

Частые вопросы

Как работают агенты в Claude Code?

Агент в Claude Code - это модель плюс набор инструментов плюс контекст сессии. Модель принимает решения, инструменты выполняют действия (читают файлы, запускают команды, обращаются к API). Harness управляет этим процессом, а вы управляете harness через CLAUDE.md, скиллы и хуки.

Как создать агента на Claude Code?

Минимально: написать CLAUDE.md с инструкциями и запустить сессию с чёткой задачей. Продвинуто: добавить скиллы для переиспользуемых блоков поведения, хуки для защиты критичных действий, и три файла состояния (plan.md, context.md, tasks.md) для работы между сессиями.

Что можно автоматизировать агентами Claude?

Практически любую задачу, которая требует чтения файлов, принятия решений и выполнения действий: рефакторинг кода, парсинг и обработка данных, генерация контента по шаблонам, тестирование, документирование. Чем выше риск действия (email, деплой, удаление), тем строже должна быть защита через хуки.

В чём отличие Claude Code агентов от обычных скриптов?

Скрипт выполняет заранее прописанную логику. Агент принимает решения в процессе: выбирает, какой инструмент вызвать, как интерпретировать результат, нужно ли уточнить задачу. Это даёт гибкость, но и ответственность: агент может принять неверное решение там, где скрипт просто упал бы с ошибкой.

Что такое intent engineering и зачем объяснять WHY?

Intent engineering - это принцип объяснять агенту не только что делать, но и зачем. Когда агент понимает цель, а не только инструкцию, он лучше справляется с краевыми случаями. "Отсортируй файлы" - инструкция. "Отсортируй файлы, чтобы было легче найти последние правки" - намерение. Anthropic официально рекомендует этот подход в документации к Opus 4.8.

Нейросети и ИИ

80,9 тыс интересуются