Добавить в корзинуПозвонить
Найти в Дзене

AI агент стал лучше, когда удалили 80% инструментов: что такое harness и зачем его обслуживать

Компания Vercel заменила 10 живых продавцов одним AI агентом. Звучит как история успеха. И она ею является - но не по той причине, которую вы подумали. Агент не победил людей за счёт мощи модели. Он победил, потому что его окружение было тщательно выстроено и постоянно поддерживается. И вот тут начинается разговор, который мало кто ведёт. Что именно удерживает агента от деградации со временем - разберём на реальных цифрах, четырёх принципах и пяти конкретных проверках. А в конце вернёмся к вопросу, который я намеренно оставлю открытым прямо сейчас. Что будет в этой статье: Harness (обвязка) - это всё, что окружает AI агент: инструкции, инструменты, источники данных, форматы вывода, права доступа, механизмы проверки. Буквально - рабочая среда агента. Модель - это мозг. Harness - это рабочий стол, на котором этот мозг функционирует. Со сломанным столом, устаревшими материалами и неправильно настроенными инструментами даже лучшая модель выдаёт мусор. Когда говорят «наш агент перестал раб
Оглавление

Компания Vercel заменила 10 живых продавцов одним AI агентом. Звучит как история успеха. И она ею является - но не по той причине, которую вы подумали. Агент не победил людей за счёт мощи модели. Он победил, потому что его окружение было тщательно выстроено и постоянно поддерживается. И вот тут начинается разговор, который мало кто ведёт.

Что именно удерживает агента от деградации со временем - разберём на реальных цифрах, четырёх принципах и пяти конкретных проверках. А в конце вернёмся к вопросу, который я намеренно оставлю открытым прямо сейчас.

Что будет в этой статье:

  • Что такое harness и чем он отличается от самого агента
  • Почему Vercel удалил 80% инструментов - и агент стал работать лучше
  • Четыре принципа, по которым harness деградирует без вашего участия
  • Как выглядит зрелый harness на примере Codex и Claude Code
  • Чек-лист из 5 вещей, которые нужно проверить у своего агента прямо сейчас

Что такое harness, и почему это не про модель

Harness (обвязка) - это всё, что окружает AI агент: инструкции, инструменты, источники данных, форматы вывода, права доступа, механизмы проверки. Буквально - рабочая среда агента.

Модель - это мозг. Harness - это рабочий стол, на котором этот мозг функционирует. Со сломанным столом, устаревшими материалами и неправильно настроенными инструментами даже лучшая модель выдаёт мусор.

Когда говорят «наш агент перестал работать», в 80% случаев имеют в виду именно harness. Обновилась база знаний, поменялась схема API, устарел документ с инструкцией - и агент начинает галлюцинировать или давать неверные ответы. Модель та же. Окружение сломалось.

Точнее - не сломалось, а устарело. Это важное различие.

Кейс Vercel: агент стал лучше после того, как убрали лишнее

Vercel - компания, которая делает хостинг для разработчиков. Несколько лет назад они построили AI агент для продаж и за шесть недель сократили команду SDR с 10 до 1 человека. Один GTM-инженер тратит 25-30% своего времени на поддержку этого агента.

Цифры впечатляют. Стоимость: около $1 000 в год против $1+ млн в год на команду. Количество касаний с лидом сократилось вдвое (с 8 до 4), при этом конверсия лид-в-сделку сохранилась. 93% обращений в поддержку закрываются без участия человека. 96% маркетингового контента начинается с агента, а человек уже редактирует.

Но вот что важно - и об этом говорит Nate Jones, который разбирал эту систему:

Агент стал работать лучше не когда добавили больше инструментов. А когда удалили 80% из них.

Казалось бы, больше возможностей - лучше результат. На деле: слишком много инструментов сбивают агента с толку. Не из-за нехватки контекстного окна (хотя и это играет роль). А потому что агент начинает выбирать между похожими опциями, делать неочевидные комбинации, путаться в пересекающихся возможностях.

Парадокс продуктивности: меньше инструментов - чище решения.

Это и есть суть обслуживания harness. Не «добавить ещё», а «убрать лишнее и обновить нужное».

Кстати, если тема интересна - в Telegram-канале пишу о подобном регулярно: инструменты, лайфхаки, конкретные сценарии использования нейросетей в жизни и бизнесе. Там проще задать вопрос и не ждать следующей статьи.

-2

Четыре принципа, которые меняют взгляд на агентов

Эти принципы сформулировал Nate Jones в своём видео про обслуживание агентов. Я бы добавил, что на практике они проявляются именно в таком порядке - сначала незаметно, потом резко.

Принцип 1. Агенты сами движутся.

Модели обновляются провайдерами. Поведение меняется. Harness, который был написан под одну версию модели, может стать некорректным после обновления. По данным The AI Runtime (июнь 2026), команды теряют около 10% первоначальных гарантий качества уже через 4-12 недель после запуска - просто за счёт дрейфа модели и инфраструктуры.

Вы ничего не трогали. Оно само изменилось.

Принцип 2. Агенты наследуют мусор окружающих систем.

Агент читает то, что ему дали. Устаревшая wiki, процессы, которые уже не применяются, дашборды с данными за позапрошлый квартал - всё это попадает в контекст и влияет на вывод. Агент не знает, что документ от 2023 года уже не актуален. Он просто работает с тем, что есть.

Или скорее - он не «знает» вообще ничего об актуальности. Это задача владельца harness.

Принцип 3. Крупные AI-компании уже это поняли.

Codex от OpenAI и Claude Code от Anthropic - это не просто «чат с кодом». Это тщательно спроектированные рабочие окружения: терминал, браузер, файловая система, плагины, память, автоматизации, одобрения, песочница, логи. Каждый компонент поддерживается отдельно. Это и есть зрелый harness - не случайный набор инструментов, а система с ответственностью за каждую часть.

Принцип 4. Вам нужен свой личный harness.

Если вы используете AI агентов в работе, у вас уже есть harness - осознаёте вы это или нет. Папки с промптами, документы с инструкциями, подключённые инструменты. Вопрос только в том, поддерживаете ли вы его осознанно.

-3

Codex и Claude Code как пример зрелого harness

На одном из проектов я переходил с ручной настройки промптов на Claude Code - и разница была заметна не в качестве модели, а в том, насколько она знала контекст. Файлы проекта, правила, история решений - всё это было частью harness, а не улетало из сессии в сессию.

Что входит в зрелый harness на примере этих инструментов:

  • Память - что агент помнит между сессиями (и что забывает)
  • Инструменты - конкретный набор действий, не «всё что можно»
  • Compaction - сжатие контекста при переполнении, чтобы не терять нить разговора
  • Логи и одобрения - агент предлагает, человек подтверждает критические шаги
  • Песочница - изолированная среда для тестирования, чтобы агент не сломал продакшн
  • Версионирование - фиксация версии модели с плановыми окнами апгрейда

Databricks в июне 2026 сформулировали это так: «Сильный harness делает среднюю модель полезной. Слабый harness тратит впустую лучшие модели.»

Как выглядит личный harness и почему его нужно поддерживать

Если вы используете AI агентов для автоматизации рутины, вот из чего, скорее всего, состоит ваш личный harness:

  • Системные промпты и шаблоны инструкций
  • Подключённые источники данных (базы знаний, документы, API)
  • Набор разрешённых инструментов и действий
  • Правила формата вывода
  • Проверочная петля (кто смотрит на результат и когда)

Вернее даже не «личный harness» - это скорее операционная система вашего агента. И она устаревает так же, как устаревает любая другая операционная система, если её не обновлять.

MindStudio рекомендует три базовые практики: явные контракты на выход (что именно должен выдавать агент), автоматические тесты этих контрактов и - что важно - назначить конкретного владельца harness. Без владельца он неизбежно устаревает. Это не технический вопрос, а организационный.

5 вещей, которые нужно проверить у своего агента прямо сейчас

Это чек-лист из видео Nate Jones. Я его немного переформулировал, но суть та же.

1. Что он читает.
Актуальны ли источники? Когда последний раз обновлялись документы в его контексте? Устаревшая wiki - это не нейтральный фон, это активный источник ошибок.

2. Его охват.
Что он может трогать? Какие инструменты подключены, какие права выданы? Если агент имеет доступ к тому, что уже не нужно - это риск и лишний шум.

3. Его работа.
Не изменилась ли задача незаметно? Бывает, что агент настраивали под один процесс, а процесс давно поменялся - и никто не обновил инструкцию.

4. Доказательства.
Даёт ли агент ссылки на источники? Если он просто утверждает - красный флаг. Если показывает откуда взял - можно проверить.

5. Ценность.
Кто-то читает вывод? Меняет ли он чьи-то решения? Если нет - агент работает вхолостую, и это тоже нужно зафиксировать.

-4

Когда стоит погрузиться в это глубже

Если у вас уже есть агент в продакшне - прямо сейчас. Не ждите пока он начнёт давать заметно плохие результаты, потому что деградация идёт постепенно и незаметно.

Если только строите - закладывайте петлю обслуживания с самого начала. Это не «потом добавим», это часть архитектуры.

Стюарт Бранд в книге «The Maintenance of Everything» (Stripe Press) проводит аналогию с парусной яхтой. Запустить - торжественный момент. Но реальная работа начинается после спуска на воду: постоянное обслуживание, проверки, замена изношенных частей. Без этого яхта не тонет сразу - она просто перестаёт слушаться руля. Автор видео называет эту книгу лучшей не-AI книгой про агентов.

Если хочется не просто читать про AI, а реально его применять, у меня есть несколько мест, где это можно делать вместе.

Начать стоит с Telegram-канала. Это наш основной ресурс, где разбираем новые инструменты, кейсы автоматизации и приёмы, которые можно применить уже завтра.

Если зайдёт, залетайте в AI BASE. Это закрытое сообщество, где я делюсь личными наработками по автоматизации, вайб-кодингу и нейросетям.

А если хочется прямо сейчас сесть и попробовать руками, есть два бесплатных курса с нуля: по n8n для автоматизации без кода и по Claude Code для разработки в связке с AI.

Частые вопросы

Что такое AI агент простыми словами?

Программа, которая получает задачу, самостоятельно планирует шаги и использует инструменты для её выполнения - без того, чтобы человек контролировал каждое действие. Harness - это всё окружение, в котором агент работает: инструкции, инструменты, источники данных.

Почему AI агент перестаёт работать правильно со временем?

Чаще всего - не из-за модели, а из-за деградации harness. Устаревают источники данных, обновляются модели с изменённым поведением, добавляются лишние инструменты. По данным The AI Runtime, команды теряют около 10% гарантий качества уже через 4-12 недель после запуска.

Как настроить обслуживание AI агента?

Минимальный вариант: назначить ответственного за harness, установить расписание ревью источников данных (раз в месяц - хорошее начало), зафиксировать версию модели и плановое окно апгрейда, добавить проверку на выходе (кто смотрит на результат).

Какие инструменты реально нужны AI агенту для автоматизации?

Меньше, чем вы думаете. Кейс Vercel показывает: удаление 80% инструментов улучшило работу агента. Начинать стоит с минимального набора и добавлять только то, без чего агент явно не справляется.

Что такое мультиагентные системы и как там с harness?

В мультиагентных системах у каждого агента свой harness, плюс появляется harness оркестратора. Если один агент устарел, он «заражает» остальных через свои выходные данные. Поэтому обслуживание harness в мультиагентных системах становится ещё критичнее.