Найти в Дзене

OpenClaw: второй подход оказался сильно интереснее первого

Недавно я уже коротко писал про OpenClaw здесь. Сейчас делаю второй подход - уже не “потыкать”, а по-настоящему поэкспериментировать. Что сделал: • выделил под него отдельный VPS • поднял в отдельном Docker-контейнере • дал доступ к управлению контейнерами • подключил Codex, чтобы экономить на токенах • добавил coding agents • разложил работу по Telegram-темам: посты, память, поездки, проверка авиабилетов И почти сразу снова уткнулся в старую проблему агентных систем. Они очень уверенно говорят, что что-то сделали, даже когда на самом деле не сделали. Попросил поставить напоминание через 15 минут. Ответ: да, поставил. Через 15 минут - тишина. Начинаю разбираться. Выясняется: он не забыл напомнить. Он просто не создал cron, а написал так, будто создал. С разработкой та же история. Если сказать что-то вроде: делай проект до конца и раз в 10 минут пиши статус то после пары шагов агент легко начинает: • повторять один и тот же план • писать, что работа идёт • но не двигаться дал

OpenClaw: второй подход оказался сильно интереснее первого

Недавно я уже коротко писал про OpenClaw здесь.

Сейчас делаю второй подход - уже не “потыкать”, а по-настоящему поэкспериментировать.

Что сделал:

• выделил под него отдельный VPS

• поднял в отдельном Docker-контейнере

• дал доступ к управлению контейнерами

• подключил Codex, чтобы экономить на токенах

• добавил coding agents

• разложил работу по Telegram-темам: посты, память, поездки, проверка авиабилетов

И почти сразу снова уткнулся в старую проблему агентных систем.

Они очень уверенно говорят, что что-то сделали, даже когда на самом деле не сделали.

Попросил поставить напоминание через 15 минут.

Ответ: да, поставил.

Через 15 минут - тишина.

Начинаю разбираться. Выясняется: он не забыл напомнить. Он просто не создал cron, а написал так, будто создал.

С разработкой та же история. Если сказать что-то вроде:

делай проект до конца и раз в 10 минут пиши статус

то после пары шагов агент легко начинает:

• повторять один и тот же план

• писать, что работа идёт

• но не двигаться дальше по факту

Пришлось жёстко дожимать контур:

• все шаги вести через backlog-файл

• выполненное явно отмечать

• следующий шаг брать только оттуда

• отложенные действия не обещать, а реально ставить в cron

• coding agents запускать под конкретные подзадачи

• статус отправлять уже после обновления состояния

И вот в таком режиме оно начинает работать заметно лучше.

Вывод пока простой: проблема AI-ассистента часто не в модели. Проблема в разрыве между словами и действием.

Если у агента нет:

• внешней памяти состояния

• backlog

• cron

• нормального цикла исполнения

то он очень легко превращается в убедительного имитатора деятельности.

Кстати, про другую сторону этой же проблемы - почему агентам вредно давать слишком много лишнего контекста сразу - я писал здесь.

Предварительный вывод такой: в агентных системах выигрывает не тот, у кого “самая умная модель”, а тот, кто лучше собрал операционный контур вокруг неё.

Больше про AI, автоматизацию и бизнес-архитектуру:

📱 Макс 📖 Дзен ✈️ Telegram

#OpenClaw #ai #автоматизация #архитектура #агенты@archfinance