Найти в Дзене
Social Mebia Systems

Где спрятаны следующие 300 «единорогов» — разбор большого отчёта об агент инструментах

Anthropic опубликовала масштабное исследование фактического использования AI‑агентов на своей публичной API‑платформе. Главный тезис отчёта: пока всё внимание и концентрированный объём вызовов приходится на одну область — программную инженерию — большинство вертикалей (медицина, юристы, финансы, образование и т.д.) остаются почти нетронутыми. Именно в этих «пустых» секторах Y Combinator видит место для сотен будущих единорогов. ОтчётAnthropic: Measuring Agent Autonomy Ключевые факты (коротко) Что это значит — «deployment overhang» AI уже может дольше и автономнее работать, чем реально позволяют пользователи. Причины: То есть технологический порог пройден — препятствие теперь в людях, процессах и доверии. Поведение пользователей: «делегировать, но контролировать» Anthropic называет это co‑building — доверие формируется через совместную работу модели, продуктовой логики и нормативов пользователя. Почему вертикали — главное поле борьбы и возможностей Garry Tan (YC) и многие инвесторы видя

Anthropic опубликовала масштабное исследование фактического использования AI‑агентов на своей публичной API‑платформе. Главный тезис отчёта: пока всё внимание и концентрированный объём вызовов приходится на одну область — программную инженерию — большинство вертикалей (медицина, юристы, финансы, образование и т.д.) остаются почти нетронутыми. Именно в этих «пустых» секторах Y Combinator видит место для сотен будущих единорогов.

ОтчётAnthropic: Measuring Agent Autonomy

Ключевые факты (коротко)

  • Программная инженерия занимает 49.7% всех вызовов агент‑инструментов — абсолютный доминант.
  • Остальные 16 вертикалей — каждая в пределах одного‑двоих процентов (медицина ~1%, юристы <1%, образование ~1.8%).
  • Claude (по независимым тестам METR) способен автономно решать задачи, на которые человеку потребовалось бы ~5 часов; на практике пользователи дают агентам в среднем лишь ~42 минуты непрерывной работы (у 99.9‑процентиля — 42 минуты).
  • Показатель «deployment overhang»: разрыв между технической готовностью и уровнем доверия/развёртывания в продуктиве.
  • В 73% вызовов человек остаётся в цикле контроля; только 0.8% операций — необратимые в реальном мире (многие «опасные» кейсы — red‑team).
  • С опытом пользователи более склонны переводить агента в «делегирование + мониторинг» (full‑auto растёт с 20% до >40% после 750+ сессий), при этом опытные пользователи чаще и активнее останавливают агентa при подозрении на ошибку.

Что это значит — «deployment overhang»

AI уже может дольше и автономнее работать, чем реально позволяют пользователи. Причины:

  • Доверие ещё не выросло до уровня, при котором компании готовы отпускать критические процессы.
  • Процессы в вертикалях сложнее, ошибки дорого стоят (регуляция, репутация, юридические риски).
  • Продуктный и организационный переход (интеграция агентов в рабочие процессы) требует времени и изменений в управлении.

То есть технологический порог пройден — препятствие теперь в людях, процессах и доверии.

Поведение пользователей: «делегировать, но контролировать»

  • Новички предпочитают пошаговый контроль.
  • Опытные пользователи переводят агентов в режим делегирования, но чаще применяют «стоп‑кнопку» — мониторят реже, вмешиваются решительно и локально.
  • Агент сам часто приостанавливается и запрашивает подтверждение в неуверенных точках — это поведение повышает безопасность и удобство доверия.

Anthropic называет это co‑building — доверие формируется через совместную работу модели, продуктовой логики и нормативов пользователя.

Почему вертикали — главное поле борьбы и возможностей

  • Код легко тестируется, откатывается и имеет низкую цену ошибки — поэтому инженерия стала первым массовым фронтом.
  • Вертикали требуют глубокого встраивания в процессы: знание регуляторики, существующих workflow, интеграции с legacy‑системами и умение управлять рисками.
  • Это делает вертикальные решения более защищёнными от быстрых копирований: barrier to entry — не только модель, но и доменный опыт + внедрение в организации.

Garry Tan (YC) и многие инвесторы видят в этом «terra incognita» — пространство для сотен сильных компаний, способных стать единорогами.

Практические выводы для предпринимателей и корпораций

Стартапам: ищите рутинные, повторяющиеся, дорогостоящие и формализуемые процессы в узких отраслях (медицинские кредиты, страховые урегулирования, контрактная проверка, логистика, регуляторный комплаенс и т. п.). Эти места дают шанс на оборонительную монетизацию и глубокую интеграцию.

Продуктовая стратегия: проектируйте режимы «делегирование + мониторинг», где агент умеет просить подтверждение, предоставлять объяснимые промежуточные шаги и иметь простой механизм отката.

Для внедрения в корпорациях: начните с ограниченных, легко откатываемых процессов (пилоты с чёткими KPI), измеряйте доверие и уменьшайте частоту вмешательств через UX/инструменты наблюдаемости.

Инвесторам: обращайте внимание не только на качество модели, но и на способность команды решать операционные, регуляторные и интеграционные барьеры конкретного сектора.

Риски и регуляторные тезисы

Жёсткий регуляторный подход, требующий «человека в цикле» для каждой операции, рискован — он может убить продуктивность без значительного выигрыша в безопасности.

Удалённые и необратимые операции действительно требуют осторожности; однако отчёт показывает, что большинство реальных кейсов — контролируемы и не необратимы.

Полезная политика — стимулировать «проверяемое делегирование»: требования к логированию, explainability и ретроспективному auditing, а не универсальный запрет на автоматизацию.

Итоговый месседж

Технология агентов выходит из фазы «может» в фазу «готово», но человеческое доверие и организационные изменения отстают. Это создает широкий и конкретный рыночный шанс: если вы умеете разобраться в отраслевой боли, встроиться в её процессы и спроектировать надежный режим делегирования, вы стоите на пороге создания бизнес‑модели, которая может вырасти до уровня единорога.

Очень краткий чек‑лист для стартапа:

  1. Найдите повторяющийся, регулируемый процесс с высокой стоимостью ошибок.
  2. Продемонстрируйте возможность возраста к исходнику и меры безопасности.
  3. Спроектируйте UX «делегирование + мониторинг».
  4. Соберите доменные данные и доказательства ROI для пилотного клиента.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/