Anthropic опубликовала масштабное исследование фактического использования AI‑агентов на своей публичной API‑платформе. Главный тезис отчёта: пока всё внимание и концентрированный объём вызовов приходится на одну область — программную инженерию — большинство вертикалей (медицина, юристы, финансы, образование и т.д.) остаются почти нетронутыми. Именно в этих «пустых» секторах Y Combinator видит место для сотен будущих единорогов.
ОтчётAnthropic: Measuring Agent Autonomy
Ключевые факты (коротко)
- Программная инженерия занимает 49.7% всех вызовов агент‑инструментов — абсолютный доминант.
- Остальные 16 вертикалей — каждая в пределах одного‑двоих процентов (медицина ~1%, юристы <1%, образование ~1.8%).
- Claude (по независимым тестам METR) способен автономно решать задачи, на которые человеку потребовалось бы ~5 часов; на практике пользователи дают агентам в среднем лишь ~42 минуты непрерывной работы (у 99.9‑процентиля — 42 минуты).
- Показатель «deployment overhang»: разрыв между технической готовностью и уровнем доверия/развёртывания в продуктиве.
- В 73% вызовов человек остаётся в цикле контроля; только 0.8% операций — необратимые в реальном мире (многие «опасные» кейсы — red‑team).
- С опытом пользователи более склонны переводить агента в «делегирование + мониторинг» (full‑auto растёт с 20% до >40% после 750+ сессий), при этом опытные пользователи чаще и активнее останавливают агентa при подозрении на ошибку.
Что это значит — «deployment overhang»
AI уже может дольше и автономнее работать, чем реально позволяют пользователи. Причины:
- Доверие ещё не выросло до уровня, при котором компании готовы отпускать критические процессы.
- Процессы в вертикалях сложнее, ошибки дорого стоят (регуляция, репутация, юридические риски).
- Продуктный и организационный переход (интеграция агентов в рабочие процессы) требует времени и изменений в управлении.
То есть технологический порог пройден — препятствие теперь в людях, процессах и доверии.
Поведение пользователей: «делегировать, но контролировать»
- Новички предпочитают пошаговый контроль.
- Опытные пользователи переводят агентов в режим делегирования, но чаще применяют «стоп‑кнопку» — мониторят реже, вмешиваются решительно и локально.
- Агент сам часто приостанавливается и запрашивает подтверждение в неуверенных точках — это поведение повышает безопасность и удобство доверия.
Anthropic называет это co‑building — доверие формируется через совместную работу модели, продуктовой логики и нормативов пользователя.
Почему вертикали — главное поле борьбы и возможностей
- Код легко тестируется, откатывается и имеет низкую цену ошибки — поэтому инженерия стала первым массовым фронтом.
- Вертикали требуют глубокого встраивания в процессы: знание регуляторики, существующих workflow, интеграции с legacy‑системами и умение управлять рисками.
- Это делает вертикальные решения более защищёнными от быстрых копирований: barrier to entry — не только модель, но и доменный опыт + внедрение в организации.
Garry Tan (YC) и многие инвесторы видят в этом «terra incognita» — пространство для сотен сильных компаний, способных стать единорогами.
Практические выводы для предпринимателей и корпораций
Стартапам: ищите рутинные, повторяющиеся, дорогостоящие и формализуемые процессы в узких отраслях (медицинские кредиты, страховые урегулирования, контрактная проверка, логистика, регуляторный комплаенс и т. п.). Эти места дают шанс на оборонительную монетизацию и глубокую интеграцию.
Продуктовая стратегия: проектируйте режимы «делегирование + мониторинг», где агент умеет просить подтверждение, предоставлять объяснимые промежуточные шаги и иметь простой механизм отката.
Для внедрения в корпорациях: начните с ограниченных, легко откатываемых процессов (пилоты с чёткими KPI), измеряйте доверие и уменьшайте частоту вмешательств через UX/инструменты наблюдаемости.
Инвесторам: обращайте внимание не только на качество модели, но и на способность команды решать операционные, регуляторные и интеграционные барьеры конкретного сектора.
Риски и регуляторные тезисы
Жёсткий регуляторный подход, требующий «человека в цикле» для каждой операции, рискован — он может убить продуктивность без значительного выигрыша в безопасности.
Удалённые и необратимые операции действительно требуют осторожности; однако отчёт показывает, что большинство реальных кейсов — контролируемы и не необратимы.
Полезная политика — стимулировать «проверяемое делегирование»: требования к логированию, explainability и ретроспективному auditing, а не универсальный запрет на автоматизацию.
Итоговый месседж
Технология агентов выходит из фазы «может» в фазу «готово», но человеческое доверие и организационные изменения отстают. Это создает широкий и конкретный рыночный шанс: если вы умеете разобраться в отраслевой боли, встроиться в её процессы и спроектировать надежный режим делегирования, вы стоите на пороге создания бизнес‑модели, которая может вырасти до уровня единорога.
Очень краткий чек‑лист для стартапа:
- Найдите повторяющийся, регулируемый процесс с высокой стоимостью ошибок.
- Продемонстрируйте возможность возраста к исходнику и меры безопасности.
- Спроектируйте UX «делегирование + мониторинг».
- Соберите доменные данные и доказательства ROI для пилотного клиента.
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/