Добавить в корзинуПозвонить
Найти в Дзене
Лямин о нейросетях

12 мая Anthropic добавили в Claude Code команду /goal

Смысл простой: ты один раз описываешь условие завершения адачи и оставляешь Claude работать самостоятельно. После каждого шага отдельная маленькая модель смотрит на переписку и решает, готово или нет. Если нет — Claude идёт на следующий ход без вопросов.    Для меня это решение главной боли. Claude по умолчанию вежливый до невозможности: «вот мой план, если согласен — приступаю», «уточни прежде чем продолжу», «хочешь, я сделаю Х?». На длинных задачах это убивает. У Codex такой проблемы нет — сказал и ушёл пить кофе на два часа. Теперь похожий режим есть и в Claude Code.    Но есть нюанс, на котором все спотыкаются. Проверяющая модель не запускает тесты, не открывает файлы, не лезет в систему — она читает только чат. Поэтому если условие нельзя проверить по переписке, /goal либо зациклится, либо ложно отрапортует «готово».    Отсюда три правила, которые экономят токены и нервы. Первое — формулировать условие как acceptance criteria, а не как пожелание. «Все юнит-тесты в tests/auth зелё

12 мая Anthropic добавили в Claude Code команду /goal

Смысл простой: ты один раз описываешь условие завершения адачи и оставляешь Claude работать самостоятельно. После каждого шага отдельная маленькая модель смотрит на переписку и решает, готово или нет. Если нет — Claude идёт на следующий ход без вопросов.

  

Для меня это решение главной боли. Claude по умолчанию вежливый до невозможности: «вот мой план, если согласен — приступаю», «уточни прежде чем продолжу», «хочешь, я сделаю Х?». На длинных задачах это убивает. У Codex такой проблемы нет — сказал и ушёл пить кофе на два часа. Теперь похожий режим есть и в Claude Code.

  

Но есть нюанс, на котором все спотыкаются. Проверяющая модель не запускает тесты, не открывает файлы, не лезет в систему — она читает только чат. Поэтому если условие нельзя проверить по переписке, /goal либо зациклится, либо ложно отрапортует «готово».

  

Отсюда три правила, которые экономят токены и нервы.

Первое — формулировать условие как acceptance criteria, а не как пожелание. «Все юнит-тесты в tests/auth зелёные,

  линтер чист» работает. «Почини баги» не работает: какие баги, как проверить.

Второе — требовать артефакт в чате. «В конце вывести содержимое CHANGELOG.md и список изменённых файлов» — теперь у проверяющей модели есть на что смотреть. Без этого она видит «я всё сделал» и верит на слово, потому что больше ей опереться не на что.

  

Третье — одна /goal равна одной атомарной цели. Если задача звучит как «отрефакторь авторизацию, добавь OAuth, напиши тесты и обнови доки» — это четыре /goal последовательно. Составные цели путают и исполнителя, и оценщика: один кусок сделан, другой нет, и весь цикл уходит в круги.

  

Расскажу на свежем кейсе. В Swipely у меня обвалилась воронка активации — с 74% до 12,5%. Надо было восстановить реальный CJM пользователей за 30 дней по данным PostHog и найти, где именно течёт. Раньше я бы сел рядом с Claude и часов пять водил его за руку: «теперь построй воронку», «теперь подними рейдж-клики», «теперь сходи в session replay».

  

  С /goal сделал иначе. Условие было примерно такое:

 

Результат работы: в чат выведен markdown-отчёт со ссылками на инсайты в PostHog. В отчёте — воронка signup →  carousel_generated → payment за 30 дней с абсолютными цифрами и процентами на каждом шаге; топ-10 ошибок chat_tool_called с полными текстами; временной срез по дням, подтверждающий или опровергающий слом 13 мая; пять  когорт обрыва с user_id; топ-5 bottleneck-ов с количеством теряемых юзеров, гипотезой причины и однострочным фиксом. Создан дашборд «Swipely — Real CJM 30d» с инсайтами из отчёта. Источники — только PostHog и git log. Без догадок: каждая цифра подтверждена HogQL-запросом или replay-ссылкой.

Включил auto mode и ушёл на встречи. Через пару часов вернулся — лежит отчёт с реальными цифрами, дашборд собран,

точка слома подтверждена конкретным деплоем из git log, к каждому bottleneck приложены пять user_id и ссылки на

сессии. Я просто пошёл смотреть replay и чинить.

  

Ключевое здесь — я не просил «проанализируй продукт». Я расписал, что должно лежать на выходе: какие разрезы, какие

источники, в каком виде. Без этой конкретики Claude бы либо застрял на первом шаге со словами «уточни, что именно

посмотреть», либо отрапортовал «готово» с тремя графиками без выводов.