188 подписчиков

AI-агенты в Q1 2026: что изменилось

6 апреля6 апр

1 мин

? Первый квартал закрыт. Самое время посмотреть на цифры — не на маркетинг, а на то, что происходит в продакшне. Начну с того, что зацепило больше всего. За первые 2,5 месяца 2026 года вышло 267 моделей — рекорд за всю историю генеративного AI. Claude Opus 4.6, GPT-5.3 Codex, Gemini 3.1 Pro — все в течение двух-трех недель. Цикл обновления сжался настолько, что архитектурные решения на базе конкретной модели устаревают быстрее, чем заканчиваются пилоты. Вопрос выбора модели из технического стал стратегическим. Что ещё важно по игрокам: 👉 GPT-5.4 впервые превысил человеческий уровень на бенчмарке по управлению десктопом — 75.0% против 72.4% у человека. Практический сигнал для всех, кто занимается автоматизацией и RPA 👉 Salesforce Agentforce — $800 млн ARR, рост 169% год к году. Показательно другое: Salesforce первой в индустрии начала считать не лицензионные места, а реальный труд агентов — «агентные work units». Рынок постепенно находит метрику 👉 Tencent встроил AI-агента прямо

AI-агенты в Q1 2026: что изменилось?

Первый квартал закрыт. Самое время посмотреть на цифры — не на маркетинг, а на то, что происходит в продакшне. Начну с того, что зацепило больше всего.

За первые 2,5 месяца 2026 года вышло 267 моделей — рекорд за всю историю генеративного AI. Claude Opus 4.6, GPT-5.3 Codex, Gemini 3.1 Pro — все в течение двух-трех недель. Цикл обновления сжался настолько, что архитектурные решения на базе конкретной модели устаревают быстрее, чем заканчиваются пилоты. Вопрос выбора модели из технического стал стратегическим.

Что ещё важно по игрокам:

👉 GPT-5.4 впервые превысил человеческий уровень на бенчмарке по управлению десктопом — 75.0% против 72.4% у человека. Практический сигнал для всех, кто занимается автоматизацией и RPA

👉 Salesforce Agentforce — $800 млн ARR, рост 169% год к году. Показательно другое: Salesforce первой в индустрии начала считать не лицензионные места, а реальный труд агентов — «агентные work units». Рынок постепенно находит метрику

👉 Tencent встроил AI-агента прямо в WeChat — 1 млрд пользователей получили доступ без установки нового приложения. Китайская логика простая: не строить отдельный продукт, а встроить агента туда, где аудитория уже есть

👉 MCP (Model Context Protocol) — в январе все четыре крупнейших вендора сошлись на едином стандарте интеграции агентов. Управление передано Linux Foundation. Это примерно то же, чем HTTP стал для веба — агентный слой переходит в статус инфраструктуры

Теперь про то, о чём говорят реже.

Сам ни раз сталкивался с тем, что разрыв между демо и продакшном в агентных системах — не технический, а организационный. Данные это подтверждают:

❌ Carnegie Mellon протестировал агентов на рутинных офисных задачах — справились только с 24%. Средняя стоимость одной попытки (включая провальные) — $6

❌ 42% корпоративных AI-инициатив в 2026 году свёрнуты, не выйдя за рамки пилота

❌ Математика сложных задач беспощадна: точность агента 85% на каждом шаге — и 5-шаговый воркфлоу выполняется успешно лишь в 44% случаев

Агент не ошибается меньше из-за того, что модель стала сильнее. Он работает лучше, когда выстроены процессы контроля, понятны границы автономности и есть понимание в «головах» команды — зачем это вообще внедряется.

И в заключении хочу сказать, Gartner даёт ориентир: 40% корпоративных приложений встроят агентов к концу 2026 года. Для сравнения — в 2025-м таких было меньше 5%.

Гаджеты и электроника

5,73 млн интересуются