4243 подписчика

7 ведущих Harness: полное руководство по запуску, настройке и эксплуатации AI-агентов

19 июня19 июн

13 мин

7 ведущих Harness: полное руководство по запуску, настройке и эксплуатации AI-агентов Практическое руководство: от первого запуска до production-эксплуатации --- Введение Harness (обвязка) — это среда, в которой живёт и работает AI-агент. Без harness модель — просто дорогой автокомплит. С harness — сотрудник, который работает часами без контроля. Это руководство — пошаговая инструкция по 7 ведущим harness на рынке 2026 года. Для каждого: Что это и кому нужно Запуск и настройка Постоянная эксплуатация Основные функции агента Связки и оркестрация Плюсы, минусы, подводные камни --- 1. Claude Code (Anthropic) — универсальный агент для разработки Тип: Готовый dev-агент Цена: $200/мес (Max plan) или через API Модель: Claude Opus 4.8 / Claude Sonnet Что это Claude Code — это агентная среда разработки, которая работает прямо в терминале. Вы говорите задачу — Claude Code её выполняет: читает код, запускает тесты, правит файлы, коммитит, деплоит. Ключевая особенность: 40% кода Claude Code — это

7 ведущих Harness: полное руководство по запуску, настройке и эксплуатации AI-агентов

Практическое руководство: от первого запуска до production-эксплуатации

---

Введение

Harness (обвязка) — это среда, в которой живёт и работает AI-агент. Без harness модель — просто дорогой автокомплит. С harness — сотрудник, который работает часами без контроля.

Это руководство — пошаговая инструкция по 7 ведущим harness на рынке 2026 года. Для каждого:

Что это и кому нужно

Запуск и настройка

Постоянная эксплуатация

Основные функции агента

Связки и оркестрация

Плюсы, минусы, подводные камни

---

1. Claude Code (Anthropic) — универсальный агент для разработки

Тип: Готовый dev-агент

Цена: $200/мес (Max plan) или через API

Модель: Claude Opus 4.8 / Claude Sonnet

Что это

Claude Code — это агентная среда разработки, которая работает прямо в терминале. Вы говорите задачу — Claude Code её выполняет: читает код, запускает тесты, правит файлы, коммитит, деплоит.

Ключевая особенность: 40% кода Claude Code — это harness, а не модель. Anthropic вложил почти половину инженерных усилий в обвязку (подтверждено утечкой марта 2026).

Запуск и настройка

```bash

# Установка

npm install -g @anthropic-ai/claude-code

# Активация в проекте

cd my-project

claude

# Первый запуск — авторизация через браузер

# Откроется страница Anthropic, войдите в аккаунт

```

Проверка версии (важно для Dynamic Workflows):

```bash

claude --version

# Должно быть >= 2.1.154

```

Основные функции агента

Базовый режим — просто говорите задачи:

```

> Напиши тесты для модуля auth.py

> Найди баг в функции process\_payment

> Отрефактори этот файл, вынеси логику в отдельные функции

```

Dynamic Workflows (режим «ультракод»):

```

> ultracode Проверь все API-эндпоинты на отсутствие авторизации

```

После этой команды Claude Code:

Анализирует задачу — какой паттерн harness нужен

Собирает обвязку: сабагенты, проверки, циклы

Запускает параллельных агентов

Каждый агент получает чистый контекст и узкую задачу

Результаты склеиваются

6 паттернов Dynamic Workflows (встроены в модель):

Паттерн Описание Когда применять

Classify & Act Разобрать поток на типы, каждый тип → свой обработчик Обработка почты, тикетов, инцидентов

Fan-out & Synthesize Десятки агентов параллельно, склейка в один ответ Рефакторинг всего проекта

Adversarial Verification Один пишет, второй ищет дыры Код-ревью, безопасность

Generate & Filter Накидать 100 идей → отфильтровать до 3 Брейншторм, архитектура

Tournament Несколько подходов → турнир → лучший Выбор архитектуры

Loop Until Done Делать → проверять → переделывать, пока не зелёное Фикс багов, CI/CD

Постоянная эксплуатация

Для долгих задач (часы работы):

```bash

# Установить effort на всю сессию

/effort ultracode

# Теперь каждая задача автоматически через workflow

```

Фоновый режим:

```bash

claude --bg "Проверь все файлы на утечку API-ключей"

# Можно закрыть терминал — агент продолжит

```

Чекпоинты: Если сессия прервалась, при следующем запуске Claude Code спросит: «Продолжить последнюю сессию?»

Совет: Перед сложной задачей используйте `/compact` — сжатие контекста без потери смысла.

Связки и оркестрация

Claude Code + MCP:

```bash

# Подключение внешних инструментов

claude --mcp "github,slack,postgres"

```

Claude Code + LangGraph:

Claude Code может генерировать код для LangGraph, а LangGraph — оркестрировать нескольких Claude Code-агентов параллельно.

Claude Code + A2A:

Через A2A-протокол Claude Code может делегировать задачи другим агентам.

Плюсы и минусы

✅ Готов к работе из коробки

✅ Dynamic Workflows (единственный, кто это умеет)

✅ 6 встроенных паттернов оркестрации

✅ Активно развивается (релизы каждые 2-3 недели)

❌ $200/мес — дорого

❌ Только модели Anthropic (нельзя сменить на GPT/Gemini)

❌ Требует хорошего интернета

---

2. Codex (OpenAI) — production-платформа для AI-агентов

Тип: Production framework

Цена: Через API (pay-as-you-go)

Модель: GPT-4.1 / o-series

Что это

Codex — это не просто агент, а платформа, на которой OpenAI построила свой внутренний продукт. Кейс: 7 человек, 5 месяцев, миллион строк кода без единой строчки, написанной руками.

Философия: «Humans steer, agents execute» — люди рулят, агенты выполняют.

Запуск и настройка

```bash

# Установка

pip install openai-agents

# Инициализация

import asyncio

from agents import Agent, Runner

agent = Agent(

name="Helper",

instructions="Ты — полезный агент",

model="gpt-4.1"

)

result = asyncio.run(Runner.run(agent, "Сделай обзор кода"))

```

Через CLI (Codex Sandbox):

```bash

# Запуск sandbox-агента с файловой системой

codex sandbox --task "Провести аудит безопасности" --duration 2h

```

Основные функции агента

Sandbox Agents — изолированная среда выполнения:

```python

from agents import SandboxAgent

agent = SandboxAgent(

name="Auditor",

instructions="Проверь код на уязвимости"

)

```

Handoffs — делегирование между агентами:

```python

def transfer\_to\_reviewer(context):

return review\_agent

agent.handoffs = \[transfer\_to\_reviewer]

```

Guardrails — контроль безопасности:

```python

from agents import Guardrail

guard = Guardrail(

check=lambda x: "опасно" not in x,

action="block"

)

```

Tracing — встроенная обсервабилити:

```python

# Все вызовы логируются автоматически

# Дашборд: токены, latency, cost

```

Постоянная эксплуатация

Sessions — долгая память:

```python

from agents import Session

session = Session(id="proj-123")

result = await Runner.run(

agent,

"Продолжи вчерашнюю задачу",

session=session # восстановит контекст

)

```

Планировщик для долгих задач:

```python

agent = Agent(

name="Nightly",

instructions="Каждую ночь проверять логи",

schedule="0 2 \* \* \*" # cron-расписание

)

```

Связки и оркестрация

Codex + MCP:

```python

# Подключение инструментов через MCP

agent.tools = \["mcp://github", "mcp://jira"]

```

Codex + A2A:

Через A2A Codex может общаться с агентами на других платформах.

Codex + LangGraph:

Codex-агенты могут быть вызваны как ноды в LangGraph-графе.

Плюсы и минусы

✅ Провайдер-независим (поддерживает 100+ LLM)

✅ Встроенный Tracing, Guardrails, Sessions

✅ Sandbox Agents — изоляция и долгие задачи

✅ Бесплатный (open-source, MIT)

❌ Нет Dynamic Workflows (как у Claude Code)

❌ Меньше готовых паттернов «из коробки»

❌ Требует написания кода для настройки

---

3. Cursor — AI-IDE с готовой обвязкой

Тип: Готовый IDE

Цена: $20/мес (Pro)

Модель: Claude + GPT (выбирается)

Что это

Cursor — это модифицированный VS Code со встроенным AI-агентом. Меньше гибкости, чем Claude Code, но ниже порог входа — привычная среда разработки.

Запуск и настройка

```bash

# Скачать с cursor.com

# Установить как обычное приложение

# Войти через GitHub

# Или через CLI

npm install -g @cursorai/cli

cursor .

```

Базовые команды:

```

Cmd+K — написать код по описанию

Cmd+L — чат с AI о проекте

Cmd+Shift+K — агент: выполнить задачу

```

Основные функции агента

Agent Mode (Composer):

```

# Открыть Composer (Cmd+Shift+I)

# Написать:

"Добавь форму регистрации с валидацией,

стилизуй под брендбук, добавь обработку ошибок"

# Агент:

1. Создаёт файлы

2. Пишет код

3. Устанавливает зависимости

4. Показывает предпросмотр

```

Контекст всего проекта:

```

@file auth.ts — прикрепить файл

@folder components/ — прикрепить папку

@web — поиск в интернете

@docs react — подключить документацию

```

Apply — применение:

Агент показывает diff, вы подтверждаете или правите.

Постоянная эксплуатация

История сессий: Cursor хранит историю 30 дней. Можно вернуться к любой сессии.

Автоиндексация: Индексирует проект в фоне, так что агент знает код без вашего объяснения.

Связки и оркестрация

Cursor + MCP: Поддерживает MCP-протокол для внешних инструментов.

Cursor + Devin: Можно отправить задачу из Cursor в Devin, если задача слишком сложная.

Плюсы и минусы

✅ Привычная среда (VS Code)

✅ Низкий порог входа

✅ $20/мес — дёшево

✅ Работает с любыми моделями

❌ Меньше возможностей, чем Claude Code

❌ Нет Dynamic Workflows

❌ Тяжелее (Electron)

---

4. Devin (Cognition) — AI-сотрудник без кода

Тип: Виртуальный сотрудник

Цена: $20/мес

Модель: Своя (мультимодельная)

Что это

Devin — это не инструмент для разработчика, а AI-сотрудник. Вы ставите задачу как менеджер — Devin выполняет. Не требует знания кода.

Запуск и настройка

```bash

# Регистрация на app.cognition.ai

# Создать «проект» — папку с описанием задачи

# Или через CLI

npm install -g devin

devin start "Сделай лендинг для стартапа"

```

Как давать задачи (на русском):

```

"Создай сайт-визитку для стоматологии.

Нужны: главная, услуги, цены, контакты, запись онлайн.

Цвета: белый и голубой. Задеплой на Vercel."

```

Основные функции агента

Браузер: Devin умеет открывать браузер, кликать, заполнять формы, тестировать свои работы.

Терминал: Запускает команды, устанавливает зависимости, деплоит.

IDE: Встроенный редактор кода (можно смотреть, что он делает).

Проверка: Devin сам проверяет свою работу: запускает тесты, смотрит предпросмотр.

Постоянная эксплуатация

Фоновый режим: Закрыли ноутбук — Devin продолжает работать на сервере.

Уведомления: Пришлёт сообщение, когда задача готова.

Итерации: Можно сказать «переделай», «сделай по-другому» — Devin переделывает.

Связки и оркестрация

Devin + API: Подключается к GitHub, Vercel, AWS, Slack.

Devin + Slack: Можно давать задачи прямо из Slack.

Devin + Jira: Берёт задачи из Jira и закрывает их.

Плюсы и минусы

✅ Не требует кода

✅ Работает в фоне

✅ $20/мес — дёшево

✅ Подходит для менеджеров и бизнеса

❌ Нет контроля над моделями

❌ Медленнее специализированных harness

❌ Меньше гибкости

---

5. LangGraph (LangChain) — конструктор своих harness

Тип: Framework-конструктор

Цена: Open-source (бесплатно)

Модель: Любая (провайдер-независимый)

Что это

LangGraph — это не готовый harness, а конструктор LEGO, из которого вы собираете свой harness под свою задачу. Python + графовая модель состояний.

Кто использует: Klarna, Replit, Elastic — строят на нём свои внутренние агентские системы.

Запуск и настройка

```bash

pip install -U langgraph

# Минимальный агент

from langgraph.graph import StateGraph, MessagesState

import asyncio

# Шаг 1: определить граф

graph = StateGraph(MessagesState)

# Шаг 2: добавить узлы

async def call\_model(state):

response = await llm.ainvoke(state\["messages"])

return {"messages": \[response]}

graph.add\_node("agent", call\_model)

# Шаг 3: добавить рёбра

graph.set\_entry\_point("agent")

graph.add\_edge("agent", "\_\_end\_\_")

# Шаг 4: собрать

app = graph.compile()

```

Основные функции агента

State Management — управление состоянием:

```python

class AgentState(TypedDict):

messages: list

task: str

progress: float

results: dict

```

Чекпоинты — durable execution:

```python

from langgraph.checkpoint import PostgresSaver

saver = PostgresSaver("postgresql://...")

app = graph.compile(checkpointer=saver)

# Агент сохраняет прогресс — при сбое восстанавливается

```

Human-in-the-Loop — пауза и ревью:

```python

@app.interrupt

def review\_step(state):

# Агент остановится и спросит пользователя

return {"approved": False}

```

Subgraph — агент в агенте:

```python

sub\_agent = subgraph.compile()

main\_graph.add\_node("reviewer", sub\_agent)

# Subgraph работает как отдельный агент внутри главного

```

Постоянная эксплуатация

LangSmith — observability:

```python

# Подключение мониторинга

from langsmith import trace

with trace("my-agent"):

result = app.invoke({"messages": \[query]})

```

Production deployment:

```python

# LangGraph Platform — managed hosting

langgraph deploy

# Автоматически: HTTPS, масштабирование, мониторинг

```

Связки и оркестрация

LangGraph + MCP:

```python

from langchain\_mcp import MCPTool

tool = MCPTool("mcp://github")

graph.add\_node("github", tool)

```

LangGraph + A2A: Поддерживает A2A для межплатформенной оркестрации.

LangGraph + LangSmith: Встроенная observability и evals.

Плюсы и минусы

✅ Максимальная гибкость (собери любой harness)

✅ Durable execution (лучший в классе)

✅ HITL (Interrupts)

✅ Любые модели, любые инструменты

✅ Open-source

❌ Требует программирования (Python)

❌ Нет готовых решений — всё собирать самому

❌ Высокий порог входа

---

6. Antigravity (Google ADK) — корпоративный harness

Тип: Enterprise-платформа

Цена: В составе Google Cloud

Модель: Gemini (с адаптерами под другие)

Что это

Antigravity 2.0 — корпоративный harness от Google, заточенный под Google Cloud. Включает встроенный браузер Chromium, мультиагентную оркестрацию, динамические сабагенты, фоновые задачи.

Запуск и настройка

```bash

# Установка

pip install google-adk

# Инициализация

from google.adk import Agent, Chromium

agent = Agent(

name="Analyst",

model="gemini-2.0-pro",

tools=\[Chromium()] # встроенный браузер

)

```

Через Google Cloud Console:

```

1. Перейти в Cloud Console → AI → Antigravity

2. Создать Agent

3. Настроить роли (Planner, Executor, Verifier)

4. Развернуть одной кнопкой

```

Основные функции агента

Мультиагентная оркестрация из коробки:

Три отдельных агента работают параллельно:

Planner — планирует, разбивает на шаги

Executor — выполняет

Verifier — проверяет результат

Chromium — встроенный браузер:

```python

@agent.tool

async def check\_site(url):

page = await chromium.new\_page()

await page.goto(url)

return await page.screenshot()

```

Агент сам открывает страницы, заполняет формы, делает скриншоты.

Динамические сабагенты:

Если задача оказалась сложнее, harness сам создаёт дополнительных подагентов.

Фоновые задачи по расписанию:

```python

agent.schedule("0 \* \* \* \*") # каждый час

agent.on\_alert(lambda: check\_metrics())

```

Постоянная эксплуатация

Enterprise compliance:

Audit logs

Identity provider integration

RBAC

Всё в рамках Google Cloud

Managed deployment:

Автомасштабирование

Мониторинг через Cloud Monitoring

Recovery

Связки и оркестрация

Antigravity + Google Cloud:

Cloud Functions — прямые вызовы

Vertex AI

Cloud Storage — нативные действия, не через REST API

Pub/Sub — событийная оркестрация

Antigravity + A2A: Полная поддержка A2A.

Antigravity + MCP: Поддержка через адаптеры.

Плюсы и минусы

✅ Enterprise-ready

✅ Встроенный браузер (уникально)

✅ Мультиагентная оркестрация из коробки

✅ Compliance и аудит

❌ Только Google Cloud

❌ Закрытый продукт

❌ Дорого для малого бизнеса

---

7. Gigachain (Сбер) — российский open-source harness

Тип: Open-source framework

Цена: Бесплатно

Модель: GigaChat (через Deep Agent)

Что это

Gigachain — российская open-source обвязка на базе Deep Agent (LangChain) + GigaChat. Разрабатывается командой Константина Крестникова (Сбер).

Ключевой результат: +22,5% пункта качества без смены модели — только за счёт обвязки (собственный бенчмарк).

Запуск и настройка

```bash

# Установка

pip install gigachain

# Авторизация

from gigachain import GigaChat

llm = GigaChat(

credentials="ваш\_ключ",

model="GigaChat-Pro"

)

```

Через Deep Agent (основной путь):

```bash

pip install deep-agent gigachain-plugin

```

Основные функции агента

Auto-improvement — самоулучшение:

```python

from gigachain import Agent

agent = Agent(

llm=llm,

auto\_improve=True # агент сам подбирает правила работы

)

# За выходные подняли результат на 22.5% без смены модели

```

Benсhmark для агентов:

Собственный бенчмарк — прогон за 20 минут на любом harness:

```bash

gigachain benchmark my\_agent.py

# Через 20 минут — честная цифра, сколько агент реально умеет

```

Ralf Loop — цикл до результата:

```python

agent.loop = "ralf" # bash-цикл: запускать, пока нет done.txt

```

MetaLoop — защита от зацикливания:

Если Ralf Loop говорит «всё, я больше ничего не могу», запускается новая генерация с нуля, но видит предыдущую.

Постоянная эксплуатация

Локальные модели: Gigachain работает полностью в РФ, на российских серверах.

152-ФЗ: Соответствие законодательству о персональных данных.

Cron: Встроенный планировщик для фоновых задач.

Связки и оркестрация

Gigachain + Deep Agent: Основная связка (каркас).

Gigachain + MCP: Поддержка через LangChain-адаптеры.

Gigachain + A2A: В разработке.

Плюсы и минусы

✅ Российское решение

✅ Open-source (Apache 2.0)

✅ Работает в РФ, 152-ФЗ

✅ Активное сообщество

❌ Модель GigaChat слабее западных

❌ Меньше интеграций

❌ Сообщество меньше, чем у западных аналогов

---

Сравнительная таблица — что выбрать

Критерий Claude Code Codex Cursor Devin LangGraph Antigravity Gigachain

Тип Dev-агент Платформа IDE Сотрудник Конструктор Enterprise РФ фреймворк

Цена $200/мес API $20/мес $20/мес Бесплатно Cloud Бесплатно

Порог входа Низкий Средний Низкий Очень низкий Высокий Средний Средний

Гибкость Средняя Высокая Низкая Низкая Макс Средняя Высокая

Готовые паттерны 6 0 0 0 0 3 2

Durable + + - + ++ + +

HITL + + + - ++ + +

Dynamic WF ✅ - - - - - -

Open-source - + (MIT) - - + (MIT) - + (Apache)

РФ Нет Нет Нет Нет Да Нет Да ✅

---

Как выбрать свой harness — пошагово

Если вы разработчик и хотите «включил и работает»:

→ Claude Code (лучший) или Cursor (дешевле)

Если вы строите AI-продукт для клиентов:

→ Codex (OpenAI) или LangGraph (кастомный)

Если вы менеджер/бизнес и не пишете код:

→ Devin ($20/мес, задача словами)

Если вы крупная корпорация на Google Cloud:

→ Antigravity

Если вы в России и нужны локальные модели:

→ Gigachain

Если вы экспериментатор и готовы собирать своё:

→ LangGraph + любая модель

---

Архитектурный паттерн: связка нескольких harness

Максимальная эффективность достигается комбинацией:

```

Devin / Claude Code (фронт)

↓

A2A-протокол

↓

LangGraph (оркестрация бэкенда)

↓ ↓

Codex Gigachain

(агенты) (РФ-агенты)

```

Пример: Devin получает задачу от бизнеса → через A2A передаёт в LangGraph → LangGraph оркестрирует Codex-агентов для разработки и Gigachain для РФ-совместимости.

---

Гаджеты и электроника

5,73 млн интересуются