Сначала цифра, ради которой всё это и обсуждают: рантайм Bun переписали с Zig на Rust — 750 000 строк, 99,8% тестов зелёные, 11 дней от первого коммита до мержа. Сотни агентов писали .rs-файлы параллельно, по два рецензента на каждый, а ночной прогон вычищал лишние копии данных и сам открывал пул-реквесты. Звучит как научная фантастика, и отчасти так и есть. Но прежде чем мы захлебнёмся восторгом, две поправки, которые в новостных пересказах потерялись, — а они меняют картину.
Поправка первая: это не «внутренние тесты Anthropic». Bun переписывал Джаред Самнер — создатель самого Bun, на своём собственном проекте, через новую фичу Claude Code. Anthropic просто вынесла его кейс в анонс как витрину.
Поправка вторая, важнее: этот порт ещё не в проде. В блоге Anthropic прямым текстом: «while not yet in production». То есть 750к строк Rust с 99,8% проходящих тестов — это впечатляющая демонстрация, а не отгруженная в продакшен замена. Разница принципиальная: «прогнали миграцию, тесты в основном проходят» и «Bun теперь работает на Rust у миллионов разработчиков» — это два очень разных утверждения. Самнер обещал написать про опыт подробнее; до тех пор относимся к цифре как к лабораторному рекорду, а не серийному результату.
А теперь — почему сам заголовочный рекорд тут даже не самое интересное.
Что произошло на самом деле: оркестрация уехала из контекста в код
Заголовки кричат «Claude собрал армию агентов». Но «много агентов» — это не новость, мультиагентные сетапы все строят уже год. Настоящий сдвиг архитектурный, и он тоньше.
Динамический воркфлоу — это JavaScript-скрипт-оркестратор, который Claude пишет на лету из вашего запроса на естественном языке. А исполняет этот скрипт отдельный рантайм в фоне — ваша сессия в это время остаётся отзывчивой.
Ключевой момент, ради которого стоит читать дальше: план задачи живёт в коде скрипта, а промежуточные результаты — в переменных этого скрипта, а не в контекстном окне модели. В контекст Claude попадает только финальный ответ.
Если вы хоть раз собирали рой агентов руками — на LangGraph, на голом SDK, неважно — вы знаете, обо что они разбиваются. Наивная схема: оркестратор спавнит воркеров, и вывод каждого воркера течёт обратно в контекст оркестратора. Десять агентов — терпимо. Сотня агентов на многодневном прогоне — и контекст распухает, внимание модели плывёт (context rot), стоимость улетает в небо, а потом вы просто упираетесь в потолок окна и всё рушится. Именно поэтому большинство ручных мультиагентных паттернов потолком имеют четыре-пять субагентов: больше человек в голове не удержит, да и модель-дирижёр захлёбывается.
Так вот, вынос координации в детерминированный код снаружи диалога убирает ровно эту боль. Дирижёру больше не нужно держать в голове состояние сотни воркеров — состояние лежит в переменных скрипта. Контекст модели не пухнет. План не плывёт, как бы ни разрослась задача. Вот это, а не «сотни агентов», и есть то, что делает масштаб реально достижимым.
Как это устроено под капотом
Разберём механику по косточкам — тут как раз вкусные инженерные детали:
⚙️ Claude пишет оркестрационный скрипт, рантайм его гоняет. Вы описываете задачу словами — Claude декомпозирует её, генерит JS-скрипт с планом fan-out, рантайм запускает. Это и есть отличие от обычных субагентов: план — это артефакт в коде, а не цепочка решений в голове модели.
🔢 Жёсткие лимиты на параллелизм. По данным MarkTechPost, рантайм держит до 16 агентов одновременно и не больше 1000 агентов суммарно на один прогон. Разумные предохранители, чтобы один «создай воркфлоу» не превратился в неуправляемый форк-бомб из агентов.
🔒 Граница безопасности. Сам скрипт-оркестратор не имеет доступа к файловой системе и шеллу — читать, писать и выполнять команды могут только агенты-воркеры. То есть координирующий слой засендбокшен, а грязную работу делают исполнители. Для тех, кто переживает за то, что автономный рой делает в вашем репозитории, — это правильное разделение ответственности.
🥊 Состязательная верификация. Агенты бьют по задаче с независимых сторон, другие агенты пытаются опровергнуть их находки, и прогон итерируется, пока ответы не сойдутся. Это не «модель сама себе поставила зачёт» — это встроенный ред-тиминг. Отсюда и обещание «results a single pass can't» — результат, недостижимый за один проход.
💾 Резюмируемость. Прогресс чекпойнтится по ходу: если прогон прервался, он подхватывается с места обрыва, а уже завершённые агенты возвращают закешированный результат вместо повторного запуска. Для многочасовых и многодневных задач это критично — иначе любой обрыв означал бы старт с нуля.
🔬 /deep-research теперь встроенный воркфлоу, а вся фича требует Claude Code версии 2.1.154+.
Возвращаясь к кейсу Bun, теперь видно, что за «магией» стоял конвейер из нескольких воркфлоу: один прогон проставил корректный Rust-lifetime каждому полю каждой структуры из Zig-кодовой базы (а кто писал на Rust, понимает, что лайфтаймы — это половина боли при портировании), следующий писал каждый .rs-файл как поведенчески идентичный порт своего .zig-аналога, потом fix-loop гонял сборку и тесты до зелёного. Это не «нажал кнопку — получил рантайм», это грамотно декомпозированная инженерная задача, отданная рою.
Чем это отличается от субагентов и скиллов
Тонкий, но важный вопрос — у кого находится план:
📌 Обычный субагент: Claude сам, ход за ходом, решает, какого воркера спавнить, и каждый промежуточный результат оседает в его контексте. Гибко, но плохо масштабируется.
📋 Скилл: Claude идёт по последовательности, прописанной в Markdown-файле, но всё ещё сам дирижирует потоком.
🐝 Динамический воркфлоу: план переезжает в JS-скрипт, который крутит отдельный рантайм, а координация уходит из диалога. Дирижёр перестаёт быть бутылочным горлышком.
Тестер из CyberAgent сформулировал это удачно: воркфлоу закрывают разрыв между «запустить одного субагента» и «выстроить полноценную команду агентов». Это средний слой оркестрации, которого раньше не хватало.
Где это реально полезно — и во что обойдётся
Официальные сценарии и кто что уже погонял:
🔍 Аудиты безопасности и охота на баги по всей кодовой базе. Claude параллельно прочёсывает сервис, а потом независимо верифицирует каждую находку, чтобы в отчёт попали реальные проблемы, а не шум. Для тех, кто живёт в пентесте и баг-баунти, это прямо в десятку: параллельный поиск плюс отсев false positives — ровно то, на что обычно уходят дни ручной работы. Тот же шаблон работает для hardening-проходов: проверки авторизации, валидация входных данных, поиск небезопасных паттернов.
🔄 Большие миграции и модернизация: смена фреймворков, депрекейшен API, портирование языков на тысячи файлов end-to-end (собственно, кейс Bun).
✅ Работа, которую критично перепроверить дважды: когда цена ошибки высока, воркфлоу даёт независимые попытки и состязательных агентов, ломающих результат до того, как он дойдёт до вас.
💸 Но за всё это платят токенами — и много. Anthropic нетипично для себя выкатила прямое предупреждение: динамические воркфлоу жрут существенно больше токенов, чем обычная сессия Claude Code, поэтому начинать стоит со скромной, ограниченной задачи, чтобы пощупать расход. При первом запуске Claude Code показывает, что именно собирается выполнить, и просит подтверждение — здравая защита от «упс, я не думал, что оно поднимет 800 агентов».
🏢 Доступность и как включить. Research preview в CLI, Desktop и расширении для VS Code, плюс через API и на Bedrock, Vertex AI и Microsoft Foundry. На планах Max и Team (и через API) фича включена по умолчанию; на Enterprise — выключена по умолчанию, админ включает в настройках Claude Code. Запуск — двумя способами: либо прямой командой «создай workflow», либо новым режимом ultracode в меню усилий (он выставляет уровень xhigh и позволяет Claude самому решать, когда подключать воркфлоу). Для лучшего опыта советуют включить auto mode.
Вывод и прогноз
Если отжать хайп: «армия агентов» — это упаковка, а суть в том, что оркестрацию вынесли из контекстного окна LLM в детерминированный код с отдельным рантаймом. Это менее эффектно звучит, но именно это снимает потолок, об который бились все самописные рои. Состязательная верификация и резюмируемость превращают это из игрушки в инструмент для многодневных прогонов.
Кейс Bun я бы держал в голове со звёздочкой: цифры реальные и впечатляющие, но это демонстрация от создателя проекта, ещё не доехавшая до прода. Когда Самнер опубликует разбор — вот тогда будет видно, сколько в этих 99,8% реального качества и сколько подводных камней всплыло на пути к продакшену. Пока же это сильный сигнал о возможностях, а не доказательство, что миграции легаси теперь решаются нажатием кнопки.
Мой прогноз: следующий год пройдёт под знаком оркестрации как отдельного слоя инфраструктуры. То, что Anthropic выкатила это сразу на VS Code, Bedrock, Vertex и Foundry в день релиза, — заявка на то, что динамические воркфлоу рассматривают как core-инфраструктуру, а не как CLI-эксперимент. А заодно это удобный момент пересобрать свои ручные LangGraph-пайплайны: возможно, половину вашей логики оркестрации теперь должен писать сам агент, а вы — только описывать задачу и проверять результат. Главный вопрос на 2026-й уже не «умеет ли ИИ кодить», а «насколько ему можно доверить ночную смену из тысячи агентов в вашем репозитории».
Источники
🔗 Официальный анонс (Claude.com): https://claude.com/blog/introducing-dynamic-workflows-in-claude-code
📖 Полный разбор (Telegraph): https://telegra.ph/Dinamicheskie-vorkflou-v-Claude-Code-kogda-II-perestayot-byt-odinochkoj-i-sobiraet-komandu-05-28
📄 Документация по воркфлоу: https://code.claude.com/docs/en/workflows
⚙️ Технические детали (лимиты 16/1000, рантайм, песочница) — MarkTechPost: https://www.marktechpost.com/2026/05/28/anthropic-ships-claude-opus-4-8-alongside-dynamic-workflows-and-cheaper-fast-mode-with-workflows-capped-at-1000-subagents/
🚀 Релиз Claude Opus 4.8 (контекст): https://www.anthropic.com/news/claude-opus-4-8