7 ведущих Harness: полное руководство по запуску, настройке и эксплуатации AI-агентов
Практическое руководство: от первого запуска до production-эксплуатации
---
Введение
Harness (обвязка) — это среда, в которой живёт и работает AI-агент. Без harness модель — просто дорогой автокомплит. С harness — сотрудник, который работает часами без контроля.
Это руководство — пошаговая инструкция по 7 ведущим harness на рынке 2026 года. Для каждого:
Что это и кому нужно
Запуск и настройка
Постоянная эксплуатация
Основные функции агента
Связки и оркестрация
Плюсы, минусы, подводные камни
---
1. Claude Code (Anthropic) — универсальный агент для разработки
Тип: Готовый dev-агент
Цена: $200/мес (Max plan) или через API
Модель: Claude Opus 4.8 / Claude Sonnet
Что это
Claude Code — это агентная среда разработки, которая работает прямо в терминале. Вы говорите задачу — Claude Code её выполняет: читает код, запускает тесты, правит файлы, коммитит, деплоит.
Ключевая особенность: 40% кода Claude Code — это harness, а не модель. Anthropic вложил почти половину инженерных усилий в обвязку (подтверждено утечкой марта 2026).
Запуск и настройка
```bash
# Установка
npm install -g @anthropic-ai/claude-code
# Активация в проекте
cd my-project
claude
# Первый запуск — авторизация через браузер
# Откроется страница Anthropic, войдите в аккаунт
```
Проверка версии (важно для Dynamic Workflows):
```bash
claude --version
# Должно быть >= 2.1.154
```
Основные функции агента
Базовый режим — просто говорите задачи:
```
> Напиши тесты для модуля auth.py
> Найди баг в функции process\_payment
> Отрефактори этот файл, вынеси логику в отдельные функции
```
Dynamic Workflows (режим «ультракод»):
```
> ultracode Проверь все API-эндпоинты на отсутствие авторизации
```
После этой команды Claude Code:
Анализирует задачу — какой паттерн harness нужен
Собирает обвязку: сабагенты, проверки, циклы
Запускает параллельных агентов
Каждый агент получает чистый контекст и узкую задачу
Результаты склеиваются
6 паттернов Dynamic Workflows (встроены в модель):
Паттерн Описание Когда применять
Classify & Act Разобрать поток на типы, каждый тип → свой обработчик Обработка почты, тикетов, инцидентов
Fan-out & Synthesize Десятки агентов параллельно, склейка в один ответ Рефакторинг всего проекта
Adversarial Verification Один пишет, второй ищет дыры Код-ревью, безопасность
Generate & Filter Накидать 100 идей → отфильтровать до 3 Брейншторм, архитектура
Tournament Несколько подходов → турнир → лучший Выбор архитектуры
Loop Until Done Делать → проверять → переделывать, пока не зелёное Фикс багов, CI/CD
Постоянная эксплуатация
Для долгих задач (часы работы):
```bash
# Установить effort на всю сессию
/effort ultracode
# Теперь каждая задача автоматически через workflow
```
Фоновый режим:
```bash
claude --bg "Проверь все файлы на утечку API-ключей"
# Можно закрыть терминал — агент продолжит
```
Чекпоинты: Если сессия прервалась, при следующем запуске Claude Code спросит: «Продолжить последнюю сессию?»
Совет: Перед сложной задачей используйте `/compact` — сжатие контекста без потери смысла.
Связки и оркестрация
Claude Code + MCP:
```bash
# Подключение внешних инструментов
claude --mcp "github,slack,postgres"
```
Claude Code + LangGraph:
Claude Code может генерировать код для LangGraph, а LangGraph — оркестрировать нескольких Claude Code-агентов параллельно.
Claude Code + A2A:
Через A2A-протокол Claude Code может делегировать задачи другим агентам.
Плюсы и минусы
✅ Готов к работе из коробки
✅ Dynamic Workflows (единственный, кто это умеет)
✅ 6 встроенных паттернов оркестрации
✅ Активно развивается (релизы каждые 2-3 недели)
❌ $200/мес — дорого
❌ Только модели Anthropic (нельзя сменить на GPT/Gemini)
❌ Требует хорошего интернета
---
2. Codex (OpenAI) — production-платформа для AI-агентов
Тип: Production framework
Цена: Через API (pay-as-you-go)
Модель: GPT-4.1 / o-series
Что это
Codex — это не просто агент, а платформа, на которой OpenAI построила свой внутренний продукт. Кейс: 7 человек, 5 месяцев, миллион строк кода без единой строчки, написанной руками.
Философия: «Humans steer, agents execute» — люди рулят, агенты выполняют.
Запуск и настройка
```bash
# Установка
pip install openai-agents
# Инициализация
import asyncio
from agents import Agent, Runner
agent = Agent(
name="Helper",
instructions="Ты — полезный агент",
model="gpt-4.1"
)
result = asyncio.run(Runner.run(agent, "Сделай обзор кода"))
```
Через CLI (Codex Sandbox):
```bash
# Запуск sandbox-агента с файловой системой
codex sandbox --task "Провести аудит безопасности" --duration 2h
```
Основные функции агента
Sandbox Agents — изолированная среда выполнения:
```python
from agents import SandboxAgent
agent = SandboxAgent(
name="Auditor",
instructions="Проверь код на уязвимости"
)
```
Handoffs — делегирование между агентами:
```python
def transfer\_to\_reviewer(context):
return review\_agent
agent.handoffs = \[transfer\_to\_reviewer]
```
Guardrails — контроль безопасности:
```python
from agents import Guardrail
guard = Guardrail(
check=lambda x: "опасно" not in x,
action="block"
)
```
Tracing — встроенная обсервабилити:
```python
# Все вызовы логируются автоматически
# Дашборд: токены, latency, cost
```
Постоянная эксплуатация
Sessions — долгая память:
```python
from agents import Session
session = Session(id="proj-123")
result = await Runner.run(
agent,
"Продолжи вчерашнюю задачу",
session=session # восстановит контекст
)
```
Планировщик для долгих задач:
```python
agent = Agent(
name="Nightly",
instructions="Каждую ночь проверять логи",
schedule="0 2 \* \* \*" # cron-расписание
)
```
Связки и оркестрация
Codex + MCP:
```python
# Подключение инструментов через MCP
agent.tools = \["mcp://github", "mcp://jira"]
```
Codex + A2A:
Через A2A Codex может общаться с агентами на других платформах.
Codex + LangGraph:
Codex-агенты могут быть вызваны как ноды в LangGraph-графе.
Плюсы и минусы
✅ Провайдер-независим (поддерживает 100+ LLM)
✅ Встроенный Tracing, Guardrails, Sessions
✅ Sandbox Agents — изоляция и долгие задачи
✅ Бесплатный (open-source, MIT)
❌ Нет Dynamic Workflows (как у Claude Code)
❌ Меньше готовых паттернов «из коробки»
❌ Требует написания кода для настройки
---
3. Cursor — AI-IDE с готовой обвязкой
Тип: Готовый IDE
Цена: $20/мес (Pro)
Модель: Claude + GPT (выбирается)
Что это
Cursor — это модифицированный VS Code со встроенным AI-агентом. Меньше гибкости, чем Claude Code, но ниже порог входа — привычная среда разработки.
Запуск и настройка
```bash
# Скачать с cursor.com
# Установить как обычное приложение
# Войти через GitHub
# Или через CLI
npm install -g @cursorai/cli
cursor .
```
Базовые команды:
```
Cmd+K — написать код по описанию
Cmd+L — чат с AI о проекте
Cmd+Shift+K — агент: выполнить задачу
```
Основные функции агента
Agent Mode (Composer):
```
# Открыть Composer (Cmd+Shift+I)
# Написать:
"Добавь форму регистрации с валидацией,
стилизуй под брендбук, добавь обработку ошибок"
# Агент:
1. Создаёт файлы
2. Пишет код
3. Устанавливает зависимости
4. Показывает предпросмотр
```
Контекст всего проекта:
```
@file auth.ts — прикрепить файл
@folder components/ — прикрепить папку
@web — поиск в интернете
@docs react — подключить документацию
```
Apply — применение:
Агент показывает diff, вы подтверждаете или правите.
Постоянная эксплуатация
История сессий: Cursor хранит историю 30 дней. Можно вернуться к любой сессии.
Автоиндексация: Индексирует проект в фоне, так что агент знает код без вашего объяснения.
Связки и оркестрация
Cursor + MCP: Поддерживает MCP-протокол для внешних инструментов.
Cursor + Devin: Можно отправить задачу из Cursor в Devin, если задача слишком сложная.
Плюсы и минусы
✅ Привычная среда (VS Code)
✅ Низкий порог входа
✅ $20/мес — дёшево
✅ Работает с любыми моделями
❌ Меньше возможностей, чем Claude Code
❌ Нет Dynamic Workflows
❌ Тяжелее (Electron)
---
4. Devin (Cognition) — AI-сотрудник без кода
Тип: Виртуальный сотрудник
Цена: $20/мес
Модель: Своя (мультимодельная)
Что это
Devin — это не инструмент для разработчика, а AI-сотрудник. Вы ставите задачу как менеджер — Devin выполняет. Не требует знания кода.
Запуск и настройка
```bash
# Регистрация на app.cognition.ai
# Создать «проект» — папку с описанием задачи
# Или через CLI
npm install -g devin
devin start "Сделай лендинг для стартапа"
```
Как давать задачи (на русском):
```
"Создай сайт-визитку для стоматологии.
Нужны: главная, услуги, цены, контакты, запись онлайн.
Цвета: белый и голубой. Задеплой на Vercel."
```
Основные функции агента
Браузер: Devin умеет открывать браузер, кликать, заполнять формы, тестировать свои работы.
Терминал: Запускает команды, устанавливает зависимости, деплоит.
IDE: Встроенный редактор кода (можно смотреть, что он делает).
Проверка: Devin сам проверяет свою работу: запускает тесты, смотрит предпросмотр.
Постоянная эксплуатация
Фоновый режим: Закрыли ноутбук — Devin продолжает работать на сервере.
Уведомления: Пришлёт сообщение, когда задача готова.
Итерации: Можно сказать «переделай», «сделай по-другому» — Devin переделывает.
Связки и оркестрация
Devin + API: Подключается к GitHub, Vercel, AWS, Slack.
Devin + Slack: Можно давать задачи прямо из Slack.
Devin + Jira: Берёт задачи из Jira и закрывает их.
Плюсы и минусы
✅ Не требует кода
✅ Работает в фоне
✅ $20/мес — дёшево
✅ Подходит для менеджеров и бизнеса
❌ Нет контроля над моделями
❌ Медленнее специализированных harness
❌ Меньше гибкости
---
5. LangGraph (LangChain) — конструктор своих harness
Тип: Framework-конструктор
Цена: Open-source (бесплатно)
Модель: Любая (провайдер-независимый)
Что это
LangGraph — это не готовый harness, а конструктор LEGO, из которого вы собираете свой harness под свою задачу. Python + графовая модель состояний.
Кто использует: Klarna, Replit, Elastic — строят на нём свои внутренние агентские системы.
Запуск и настройка
```bash
pip install -U langgraph
# Минимальный агент
from langgraph.graph import StateGraph, MessagesState
import asyncio
# Шаг 1: определить граф
graph = StateGraph(MessagesState)
# Шаг 2: добавить узлы
async def call\_model(state):
response = await llm.ainvoke(state\["messages"])
return {"messages": \[response]}
graph.add\_node("agent", call\_model)
# Шаг 3: добавить рёбра
graph.set\_entry\_point("agent")
graph.add\_edge("agent", "\_\_end\_\_")
# Шаг 4: собрать
app = graph.compile()
```
Основные функции агента
State Management — управление состоянием:
```python
class AgentState(TypedDict):
messages: list
task: str
progress: float
results: dict
```
Чекпоинты — durable execution:
```python
from langgraph.checkpoint import PostgresSaver
saver = PostgresSaver("postgresql://...")
app = graph.compile(checkpointer=saver)
# Агент сохраняет прогресс — при сбое восстанавливается
```
Human-in-the-Loop — пауза и ревью:
```python
@app.interrupt
def review\_step(state):
# Агент остановится и спросит пользователя
return {"approved": False}
```
Subgraph — агент в агенте:
```python
sub\_agent = subgraph.compile()
main\_graph.add\_node("reviewer", sub\_agent)
# Subgraph работает как отдельный агент внутри главного
```
Постоянная эксплуатация
LangSmith — observability:
```python
# Подключение мониторинга
from langsmith import trace
with trace("my-agent"):
result = app.invoke({"messages": \[query]})
```
Production deployment:
```python
# LangGraph Platform — managed hosting
langgraph deploy
# Автоматически: HTTPS, масштабирование, мониторинг
```
Связки и оркестрация
LangGraph + MCP:
```python
from langchain\_mcp import MCPTool
tool = MCPTool("mcp://github")
graph.add\_node("github", tool)
```
LangGraph + A2A: Поддерживает A2A для межплатформенной оркестрации.
LangGraph + LangSmith: Встроенная observability и evals.
Плюсы и минусы
✅ Максимальная гибкость (собери любой harness)
✅ Durable execution (лучший в классе)
✅ HITL (Interrupts)
✅ Любые модели, любые инструменты
✅ Open-source
❌ Требует программирования (Python)
❌ Нет готовых решений — всё собирать самому
❌ Высокий порог входа
---
6. Antigravity (Google ADK) — корпоративный harness
Тип: Enterprise-платформа
Цена: В составе Google Cloud
Модель: Gemini (с адаптерами под другие)
Что это
Antigravity 2.0 — корпоративный harness от Google, заточенный под Google Cloud. Включает встроенный браузер Chromium, мультиагентную оркестрацию, динамические сабагенты, фоновые задачи.
Запуск и настройка
```bash
# Установка
pip install google-adk
# Инициализация
from google.adk import Agent, Chromium
agent = Agent(
name="Analyst",
model="gemini-2.0-pro",
tools=\[Chromium()] # встроенный браузер
)
```
Через Google Cloud Console:
```
1. Перейти в Cloud Console → AI → Antigravity
2. Создать Agent
3. Настроить роли (Planner, Executor, Verifier)
4. Развернуть одной кнопкой
```
Основные функции агента
Мультиагентная оркестрация из коробки:
Три отдельных агента работают параллельно:
Planner — планирует, разбивает на шаги
Executor — выполняет
Verifier — проверяет результат
Chromium — встроенный браузер:
```python
@agent.tool
async def check\_site(url):
page = await chromium.new\_page()
await page.goto(url)
return await page.screenshot()
```
Агент сам открывает страницы, заполняет формы, делает скриншоты.
Динамические сабагенты:
Если задача оказалась сложнее, harness сам создаёт дополнительных подагентов.
Фоновые задачи по расписанию:
```python
agent.schedule("0 \* \* \* \*") # каждый час
agent.on\_alert(lambda: check\_metrics())
```
Постоянная эксплуатация
Enterprise compliance:
Audit logs
Identity provider integration
RBAC
Всё в рамках Google Cloud
Managed deployment:
Автомасштабирование
Мониторинг через Cloud Monitoring
Recovery
Связки и оркестрация
Antigravity + Google Cloud:
Cloud Functions — прямые вызовы
Vertex AI
Cloud Storage — нативные действия, не через REST API
Pub/Sub — событийная оркестрация
Antigravity + A2A: Полная поддержка A2A.
Antigravity + MCP: Поддержка через адаптеры.
Плюсы и минусы
✅ Enterprise-ready
✅ Встроенный браузер (уникально)
✅ Мультиагентная оркестрация из коробки
✅ Compliance и аудит
❌ Только Google Cloud
❌ Закрытый продукт
❌ Дорого для малого бизнеса
---
7. Gigachain (Сбер) — российский open-source harness
Тип: Open-source framework
Цена: Бесплатно
Модель: GigaChat (через Deep Agent)
Что это
Gigachain — российская open-source обвязка на базе Deep Agent (LangChain) + GigaChat. Разрабатывается командой Константина Крестникова (Сбер).
Ключевой результат: +22,5% пункта качества без смены модели — только за счёт обвязки (собственный бенчмарк).
Запуск и настройка
```bash
# Установка
pip install gigachain
# Авторизация
from gigachain import GigaChat
llm = GigaChat(
credentials="ваш\_ключ",
model="GigaChat-Pro"
)
```
Через Deep Agent (основной путь):
```bash
pip install deep-agent gigachain-plugin
```
Основные функции агента
Auto-improvement — самоулучшение:
```python
from gigachain import Agent
agent = Agent(
llm=llm,
auto\_improve=True # агент сам подбирает правила работы
)
# За выходные подняли результат на 22.5% без смены модели
```
Benсhmark для агентов:
Собственный бенчмарк — прогон за 20 минут на любом harness:
```bash
gigachain benchmark my\_agent.py
# Через 20 минут — честная цифра, сколько агент реально умеет
```
Ralf Loop — цикл до результата:
```python
agent.loop = "ralf" # bash-цикл: запускать, пока нет done.txt
```
MetaLoop — защита от зацикливания:
Если Ralf Loop говорит «всё, я больше ничего не могу», запускается новая генерация с нуля, но видит предыдущую.
Постоянная эксплуатация
Локальные модели: Gigachain работает полностью в РФ, на российских серверах.
152-ФЗ: Соответствие законодательству о персональных данных.
Cron: Встроенный планировщик для фоновых задач.
Связки и оркестрация
Gigachain + Deep Agent: Основная связка (каркас).
Gigachain + MCP: Поддержка через LangChain-адаптеры.
Gigachain + A2A: В разработке.
Плюсы и минусы
✅ Российское решение
✅ Open-source (Apache 2.0)
✅ Работает в РФ, 152-ФЗ
✅ Активное сообщество
❌ Модель GigaChat слабее западных
❌ Меньше интеграций
❌ Сообщество меньше, чем у западных аналогов
---
Сравнительная таблица — что выбрать
Критерий Claude Code Codex Cursor Devin LangGraph Antigravity Gigachain
Тип Dev-агент Платформа IDE Сотрудник Конструктор Enterprise РФ фреймворк
Цена $200/мес API $20/мес $20/мес Бесплатно Cloud Бесплатно
Порог входа Низкий Средний Низкий Очень низкий Высокий Средний Средний
Гибкость Средняя Высокая Низкая Низкая Макс Средняя Высокая
Готовые паттерны 6 0 0 0 0 3 2
Durable + + - + ++ + +
HITL + + + - ++ + +
Dynamic WF ✅ - - - - - -
Open-source - + (MIT) - - + (MIT) - + (Apache)
РФ Нет Нет Нет Нет Да Нет Да ✅
---
Как выбрать свой harness — пошагово
Если вы разработчик и хотите «включил и работает»:
→ Claude Code (лучший) или Cursor (дешевле)
Если вы строите AI-продукт для клиентов:
→ Codex (OpenAI) или LangGraph (кастомный)
Если вы менеджер/бизнес и не пишете код:
→ Devin ($20/мес, задача словами)
Если вы крупная корпорация на Google Cloud:
→ Antigravity
Если вы в России и нужны локальные модели:
→ Gigachain
Если вы экспериментатор и готовы собирать своё:
→ LangGraph + любая модель
---
Архитектурный паттерн: связка нескольких harness
Максимальная эффективность достигается комбинацией:
```
Devin / Claude Code (фронт)
↓
A2A-протокол
↓
LangGraph (оркестрация бэкенда)
↓ ↓
Codex Gigachain
(агенты) (РФ-агенты)
```
Пример: Devin получает задачу от бизнеса → через A2A передаёт в LangGraph → LangGraph оркестрирует Codex-агентов для разработки и Gigachain для РФ-совместимости.
---