Когда компания впервые получает доступ не к лабораторным синтетическим датасетам, а к реальному поведению миллионов пользователей, картинка ИИ меняется полностью. Именно это произошло с OpenRouter: их отчёт State of AI стал фактически самым масштабным публичным исследованием реального использования LLM — 100 триллионов токенов, прошедших через единую маршрутизирующую платформу.
Мы давно обсуждаем архитектуры, токенизации, законы масштабирования (scaling laws), “разумность” моделей… но редко задаём вопрос: а что люди на самом деле делают с ИИ?
Этот отчёт наконец даёт честный ответ. И — да — он местами полностью опровергает наши ожидания.
🛰️ ИИ в дикой природе: как выглядит 100-триллионная выборка
OpenRouter — это, по сути, «единая шина ИИ»: одна точка входа к сотням моделей. Из-за этого их данные уникальны:
- 📡 огромный объём запросов от миллионов реальных пользователей;
- 🧾 полная анонимизация (анализ только метаданных, без доступа к текстам);
- 🔀 прозрачность выбора моделей — видно, к кому и когда люди идут за работой;
- 🌍 мировая география использования.
И ключевой вывод: спрос на ИИ – не однородная масса. Это живой, динамичный, непредсказуемый ландшафт, где модели конкурируют не на бенчмарках, а за реальные человеческие задачи.
🔥 Агентное мышление стало нормой — “статичный чат” больше не существует
Особенно сильной оказалась часть исследования, посвящённая agentic inference — многозадачному, шаг-за-шагом рассуждению с инструментами.
В 2023–2024 мы воспринимали агентов как эксперимент.
В 2025 — это основной режим работы LLM.
Что это значит технически?
- 📈 более 50% всех токенов — через reasoning-модели (o1, Grok Code Fast, Gemini Pro).
- 🛠 растёт доля tool-calls: вызовы внешних инструментов теперь не исключение, а типовой сценарий.
- 🧩 последовательности стали длиннее: средний запрос вырос в 4 раза, средний ответ — почти в 3.
- 💾 основная причина длинных промптов — программирование, где в модель засовывают файлы, диффы, логи, обсёрверы.
Пользователь больше не спрашивает: “Помоги придумать идею”.
Он спрашивает: “Проанализируй вот этот проект из 7000 строк и автоматически предложи миграцию”.
Это колоссальная трансформация: LLM всё чаще работает как «виртуальная вычислительная система», а не генератор текста.
🧬 Локальная революция: open-source модели едят рынок
В отчёте есть один феномен, который сложно переоценить:
Открытые модели заняли почти треть всего рынка токенов.
И самое интересное — взрывной рост идёт из двух лагерей:
- 🇨🇳 китайские модели (Qwen, DeepSeek, Moonshot) — быстрые релизы, малые цены, высокое качество;
- 🌍 мировые OSS-модели — Mistral, LLaMA, GPT-OSS.
Если честно, то графики выглядят так, будто рынок 2023–2024 просто «не замечал» open-source, а 2025-й стал годом, когда он проснулся и начал поглощать проприетарные решения.
Почему это важно технически?
- 🔧 OSS-модели легко тонко настраивать, запускать локально, инъектировать в пайплайны.
- 🚀 Многие OSS уже обучены на reasoning-инструкциях.
- 💸 Стоят в 3–10 раз дешевле аналогов от OpenAI/Anthropic.
- 🧱 Для разработчиков — фактически бесплатный тестовый полигон.
Мы наблюдаем классическую компьютеризационную кривую: сначала — закрытые решения, потом — взрыв OSS, который формирует новый стандарт.
🎮 Ролевая игра как двигатель прогресса (да-да, серьёзно)
Вот что стало сюрпризом даже для исследователей:
Roleplay — крупнейшая категория использования OSS-моделей, до 50–60% токенов.
Не программирование (coding).
Не бизнес-аналитика.
Не резюме и не Excel.
А ролевые сценарии, персонажные диалоги, сторителлинг, симуляции поведения, эмоциональные взаимодействия.
Это объясняет, почему:
- 🧚 миллионы пользователей уходят на open-source RP-модели, а не в ChatGPT;
- 🎭 OSS-разработчики активно публикуют “persona-tuned” модели;
- 💬 длина диалогов растёт быстрее, чем сложность задач.
С точки зрения науки об ИИ, это важнее, чем кажется: RP-сценарии создают нагрузку на долговременную память, стилистическую стабильность, многотоновое управление, эмоциональные паттерны — всё, что раньше считалось “нестандартными” задачами.
👨💻 Программирование — вторая половина картины
После ролевой игры (roleplay) идёт вторая гигантская категория:
🧱 Programming & IT — более 50% всех токенов к концу 2025 года
Основные задачи:
- 🛠 анализ чужого кода;
- 🐞 отладка и устранение ошибок;
- 🔄 рефакторинг больших проектов;
- 🎛 генерация конфигураций, Dockerfile, terraform-пайплайнов;
- 📊 форматирование данных, SQL-запросы, миграции.
Интересно, что:
- 🟦 Anthropic удерживает лидирующую долю в программировании (60% и выше);
- 🟥 OpenAI наращивает долю, но медленнее;
- 🟧 Google остаётся в стабильной нише, но не доминирует;
- 🟩 OSS-модели приходят в программирование с кодерскими версиями типа Qwen Coder, GPT-OSS-20B.
По сути, LLM впервые становится реально «универсальным компилятором», который умеет интерпретировать, создавать, исправлять и оптимизировать код.
🌍 Мир ИИ теперь действительно глобальный
Статистика по регионам выглядит так:
- 🇺🇸 США — 47% токенов
- 🇸🇬 Сингапур — 9.21% (!)
- 🇩🇪 Германия — 7.51%
- 🇨🇳 Китай — 6%
- 🇰🇷 Южная Корея — 2.88%
Рост Азии — невероятный: за год доля выросла с 13% до 31%.
Это связано с:
- развитием локальных моделей (Qwen, DeepSeek, Kimi K2);
- снижением доверия к западным API;
- акселерацией ИИ-проектов и супераппов.
💎 Cinderella Glass Slipper: самый красивый результат исследования
Самый впечатляющий — и философский — раздел отчёта: ретеншен моделей.
OpenRouter обнаружил эффект, который они назвали "Cinderella Glass Slipper" — «эффект стеклянной туфельки».
Суть феномена:
- когда модель впервые идеально решает ранее невыполнимую задачу,
- у неё рождается фундаментальная когорта пользователей,
- которая остаётся с моделью почти навсегда.
💡 Если модель не попала в момент запуска в «вакуум неудовлетворённого спроса» — она не создаёт таких когорт, и рынок её не удерживает.
Примеры:
- Claude 4 Sonnet — яркая фундаментальная когорта (идеальное сочетание цены, размышления и стабильности).
- GPT-4o-mini — единственная огромная когорта при запуске, затем плато.
- Llama 4 Maverick — вообще не создала когорт → модель не “нашла свою туфельку”.
Это потрясающее наблюдение: настоящий прогресс в ИИ измеряется не бенчмарками, а появлением устойчивых когорт пользователей.
⚖️ Цена ≠ использование: рынок ИИ не похож на рынок облаков
Ещё один разрушенный миф:
Снижение цены почти не повышает использование.
Эластичность спроса крайне низкая.
В реальности:
- 💰 дорогие модели (Claude, GPT-5 Pro) используются очень активно — потому что решают сложные задачи;
- 🟡 сверхдешёвые модели часто никому не нужны — потому что не дают уникальной ценности;
- 🟢 “эффективные гиганты” вроде DeepSeek и Gemini Flash показывают лучшие ROI: низкая цена × высокая мощность.
Это значит, что рынок ИИ не движется к полной ценовой конкуренции.
Главное — качество и модель-маркет-фит, а не стоимость токена.
🔚 Куда движется ИИ в 2026 году (личное мнение автора)
По итогам анализа видно следующее:
⭐ ИИ становится слоем инфраструктуры — как интернет или электричество
Нужно не выбирать одну модель, а уметь управлять десятками.
🤖 Основной тип взаимодействия — агентность, не чат
Чистый чат умирает.
Побеждают цепочки инструментов, планирование, анализ больших контекстов.
🧠 Настоящее соревнование — не за точность, а за удержание
Если модель «попала в стеклянную туфельку», она выигрывает целый рынок.
🌐 Мир ИИ больше не западоцентричен
Китайские OSS-модели уже определяют существенную долю глобального прогресса.
👥 Две крупнейшие категории — ролевые игры и программирование
И оба они — это работа с последовательностью и контекстом, а не «писать текст».
🔗 Источники
- Исследование: https://openrouter.ai/state-of-ai