81 подписчик

Агентское кодирование: почему контекст важнее, чем сама модель ИИ

16 декабря 202516 дек 2025

6 мин

ИИ в разработке ПО давно уже перешёл за грань простого автодополнения. Знаете, что произошло дальше? Появилось так называемое агентское кодирование: системы ИИ, которые не просто пишут код, а реально планируют изменения, выполняют их в несколько шагов и учатся на ошибках. Звучит как научная фантастика, правда? Но вот штука: несмотря на весь ажиотаж вокруг «ИИ-агентов, которые кодят», в большинстве корпоративных внедрений результаты получаются посредственными. И вот самое интересное — проблема уже не в самой модели. Проблема в контексте: в структуре кода, его истории и в том, что разработчик вообще имел в виду. Иными словами, компании столкнулись с классической задачей системной архитектуры: они просто не подготовили окружение для работы этих агентов. За последний год произошёл резкий скачок: от инструментов, которые просто помогают писать код, к полноценным агентским рабочим процессам. Исследования начали формализовать, что такое агентское поведение на практике: это способность рассужд

Оглавление

От помощника к настоящему агенту
Почему инженерия контекста — это настоящий прорыв
Рабочие процессы должны меняться вместе с инструментами

ИИ в разработке ПО давно уже перешёл за грань простого автодополнения. Знаете, что произошло дальше? Появилось так называемое агентское кодирование: системы ИИ, которые не просто пишут код, а реально планируют изменения, выполняют их в несколько шагов и учатся на ошибках. Звучит как научная фантастика, правда? Но вот штука: несмотря на весь ажиотаж вокруг «ИИ-агентов, которые кодят», в большинстве корпоративных внедрений результаты получаются посредственными. И вот самое интересное — проблема уже не в самой модели. Проблема в контексте: в структуре кода, его истории и в том, что разработчик вообще имел в виду. Иными словами, компании столкнулись с классической задачей системной архитектуры: они просто не подготовили окружение для работы этих агентов.

От помощника к настоящему агенту

За последний год произошёл резкий скачок: от инструментов, которые просто помогают писать код, к полноценным агентским рабочим процессам. Исследования начали формализовать, что такое агентское поведение на практике: это способность рассуждать о дизайне, тестировании, выполнении и проверке результата, а не просто генерировать отдельные кусочки кода. Вот такая работа, как динамическое переопробование действий, показала — если позволить агентам ветвиться, пересчитывать и переделывать свои решения, результаты становятся намного лучше в больших взаимозависимых проектах. На уровне платформ компании вроде GitHub уже строят специальные окружения для оркестрации агентов, такие как Copilot Agent и Agent HQ, чтобы поддерживать сотрудничество нескольких агентов прямо внутри реальных корпоративных пайплайнов.

Но реальная практика рассказывает грустную историю. Когда организации внедряют агентские инструменты без переделки рабочего процесса и окружения — производительность может упасть. По данным рандомизированного исследования, проведённому в этом году, разработчики, которые использовали ИИ-помощь в неизменённых процессах, выполняли задачи медленнее. Причина? Постоянная проверка, переделки и неясность того, что агент вообще должен был сделать. Вывод прост как кирпич: автономность без нормальной организации редко даёт эффективность.

Почему инженерия контекста — это настоящий прорыв

Вот я посмотрел на все провальные внедрения, которые видел — везде одна и та же история. Агентам не хватает структурированного понимания кодовой базы, то есть её модулей, графа зависимостей, системы тестирования, архитектурных соглашений и истории изменений. Результат? Агент генерирует код, который с виду правильный, но совсем не соответствует реальности. Слишком много информации — агента перегружает, слишком мало — он просто гадает. Дело не в том, чтобы скормить модели больше токенов. Дело в том, чтобы определить, что должен видеть агент, когда это видеть и в какой форме.

Команды, которые добились реальных успехов, относятся к контексту как к инженерной проблеме. Они создают инструменты, чтобы снимать снимки состояния, сжимать и версионировать рабочую память агента: что сохраняется между шагами, что отбрасывается, что приводится к краткой форме, что связывается вместо встраивания. Они проектируют этапы размышления, а не сессии с подсказками. Они делают спецификацию полноценным артефактом — чем-то, что можно посмотреть, протестировать и за что кто-то отвечает, а не просто преходящей историей чата. Эта смена приемов совпадает с более широким трендом, который некоторые исследователи описывают как «спецификация становится новым источником истины».

Рабочие процессы должны меняться вместе с инструментами

Но одного контекста недостаточно. Компаниям нужно переделать рабочие процессы вокруг этих агентов. Вот как писали в отчёте McKinsey за 2025 год «Год агентского ИИ»: прибыль приходит не от того, что положили ИИ поверх существующих процессов, а от переделки самого процесса. Когда команда просто закидывает агента в неизменённый рабочий процесс — начинается кошмар: инженеры тратят больше времени на проверку кода, написанного ИИ, чем потратили бы на его собственное написание. Агенты могут только усилить то, что уже структурировано: хорошо протестированные, модульные кодовые базы с чётким разделением ответственности и документацией. Без этих оснований автономность превращается в хаос.

Безопасность и управление тоже требуют переосмысления. Код, написанный ИИ, несёт новые риски: непроверенные зависимости, тонкие нарушения лицензий и недокументированные модули, которые скользнут мимо код-ревью. Опытные команды начинают встраивать агентскую активность прямо в свои CI/CD пайплайны — они рассматривают агентов как автономных участников, чья работа должна пройти те же проверки статического анализа, логирование аудита и врата одобрения, что и у любого обычного разработчика. Даже сама документация GitHub указывает на этот путь, позиционируя Copilot Agents не как замену инженерам, а как организованных участников безопасных, проверяемых рабочих процессов. Цель не в том, чтобы ИИ «написал всё», а в том, чтобы когда он что-то делает, он это делал внутри чётких ограничений.

На что должны сосредоточиться руководители компаний

Для технических лидеров путь начинается с подготовки, а не с гайпа. Монолиты с редкими тестами редко дают прирост; агенты действительно работают там, где тесты — это источник истины и могут направлять итеративное улучшение. Именно этот цикл Anthropic выделяет для агентов-кодировщиков. Пилотные проекты в узко определённых областях: генерация тестов, модернизация старого кода, изолированные рефакторы. Относитесь к каждому внедрению как к эксперименту с явными метриками: сколько ошибок прошло в production, сколько времени занимает PR-цикл, какая частота провалов изменений, сколько уязвимостей выявлено. По мере роста использования относитесь к агентам как к данным инфраструктуры: каждый план, снимок контекста, журнал действий и результат теста — это данные, которые складываются в поискомую память инженерного намерения и дают долгосрочное конкурентное преимущество.

Под капотом агентское кодирование — это вообще не столько проблема инструментов, сколько проблема данных. Каждый снимок контекста, итерация теста и ревизия кода становятся структурированными данными, которые нужно хранить, индексировать и переиспользовать. По мере распространения агентов компании столкнутся с совершенно новым слоем данных: слоем, который фиксирует не только то, что было построено, но и то, как это обосновывалось. Эта смена превращает логи инженерных работ в граф знаний — граф намерений, решений и проверок. Со временем организации, которые смогут искать и переигрывать эту контекстную память, оставят позади те, что ещё рассматривают код как просто текст.

Грядущий год вероятно определит, станет ли агентское кодирование краеугольным камнем корпоративной разработки или просто ещё одним раздутым обещанием. Ставка на инженерию контекста: на то, насколько умно команды спроектируют информационный слой, на котором работают агенты. Победители — это те, кто видит автономность не как волшебство, а как расширение дисциплинированного системного проектирования: чёткие рабочие процессы, измеримая обратная связь и строгое управление.

Суть дела

Платформы схождаются на оркестрации и ограничениях, исследования продолжают улучшать контроль контекста на этапе инференса. Победители в течение 12-24 месяцев — не те, у кого самая красивая модель. Это те, кто инженерит контекст как актив и рассматривает рабочий процесс как продукт. Сделайте это — и автономность начнёт давать результаты. Пропустите эту часть — и очередь проверок просто рухнет.

Контекст плюс агент равно рычаг действия. Забудьте про первую половину — остальное развалится.

Dhyey Mavani ускоряет развитие генеративного ИИ в LinkedIn.

Агентское кодирование и контекстная инженерия — вот что будет определять успех корпоративного ИИ в ближайшие годы. Если вы хотите оставаться в курсе последних достижений и не пропустить ключевые тренды в мире ИИ — вам сюда.🔔 Чтобы больше узнать об агентском ИИ, контекстной инженерии и других передовых практиках, подпишитесь на канал «ProAI» в Telegram!