Добавить в корзинуПозвонить
Найти в Дзене
Цифровая Переплавка

100 триллионов токенов: что на самом деле происходит в мире ИИ — и почему исследование OpenRouter стало поворотной точкой

Когда компания впервые получает доступ не к лабораторным синтетическим датасетам, а к реальному поведению миллионов пользователей, картинка ИИ меняется полностью. Именно это произошло с OpenRouter: их отчёт State of AI стал фактически самым масштабным публичным исследованием реального использования LLM — 100 триллионов токенов, прошедших через единую маршрутизирующую платформу. Мы давно обсуждаем архитектуры, токенизации, законы масштабирования (scaling laws), “разумность” моделей… но редко задаём вопрос: а что люди на самом деле делают с ИИ? Этот отчёт наконец даёт честный ответ. И — да — он местами полностью опровергает наши ожидания. 🛰️ ИИ в дикой природе: как выглядит 100-триллионная выборка OpenRouter — это, по сути, «единая шина ИИ»: одна точка входа к сотням моделей. Из-за этого их данные уникальны: 📡 огромный объём запросов от миллионов реальных пользователей; 🧾 полная анонимизация (анализ только метаданных, без доступа к текстам); 🔀 прозрачность выбора моделей — видно, к
Оглавление

Когда компания впервые получает доступ не к лабораторным синтетическим датасетам, а к реальному поведению миллионов пользователей, картинка ИИ меняется полностью. Именно это произошло с OpenRouter: их отчёт State of AI стал фактически самым масштабным публичным исследованием реального использования LLM — 100 триллионов токенов, прошедших через единую маршрутизирующую платформу.

Мы давно обсуждаем архитектуры, токенизации, законы масштабирования (scaling laws), “разумность” моделей… но редко задаём вопрос: а что люди на самом деле делают с ИИ?

Этот отчёт наконец даёт честный ответ. И — да — он местами полностью опровергает наши ожидания.

🛰️ ИИ в дикой природе: как выглядит 100-триллионная выборка

OpenRouter — это, по сути, «единая шина ИИ»: одна точка входа к сотням моделей. Из-за этого их данные уникальны:

  • 📡 огромный объём запросов от миллионов реальных пользователей;
  • 🧾 полная анонимизация (анализ только метаданных, без доступа к текстам);
  • 🔀 прозрачность выбора моделей — видно, к кому и когда люди идут за работой;
  • 🌍 мировая география использования.

И ключевой вывод: спрос на ИИ – не однородная масса. Это живой, динамичный, непредсказуемый ландшафт, где модели конкурируют не на бенчмарках, а за реальные человеческие задачи.

🔥 Агентное мышление стало нормой — “статичный чат” больше не существует

Особенно сильной оказалась часть исследования, посвящённая agentic inference — многозадачному, шаг-за-шагом рассуждению с инструментами.

В 2023–2024 мы воспринимали агентов как эксперимент.
В 2025 — это
основной режим работы LLM.

Что это значит технически?

  • 📈 более 50% всех токенов — через reasoning-модели (o1, Grok Code Fast, Gemini Pro).
  • 🛠 растёт доля tool-calls: вызовы внешних инструментов теперь не исключение, а типовой сценарий.
  • 🧩 последовательности стали длиннее: средний запрос вырос в 4 раза, средний ответ — почти в 3.
  • 💾 основная причина длинных промптов — программирование, где в модель засовывают файлы, диффы, логи, обсёрверы.

Пользователь больше не спрашивает: “Помоги придумать идею”.
Он спрашивает: “Проанализируй вот этот проект из 7000 строк и автоматически предложи миграцию”.

Это колоссальная трансформация: LLM всё чаще работает как «виртуальная вычислительная система», а не генератор текста.

🧬 Локальная революция: open-source модели едят рынок

В отчёте есть один феномен, который сложно переоценить:

Открытые модели заняли почти треть всего рынка токенов.

И самое интересное — взрывной рост идёт из двух лагерей:

  • 🇨🇳 китайские модели (Qwen, DeepSeek, Moonshot) — быстрые релизы, малые цены, высокое качество;
  • 🌍 мировые OSS-модели — Mistral, LLaMA, GPT-OSS.

Если честно, то графики выглядят так, будто рынок 2023–2024 просто «не замечал» open-source, а 2025-й стал годом, когда он проснулся и начал поглощать проприетарные решения.

Почему это важно технически?

  • 🔧 OSS-модели легко тонко настраивать, запускать локально, инъектировать в пайплайны.
  • 🚀 Многие OSS уже обучены на reasoning-инструкциях.
  • 💸 Стоят в 3–10 раз дешевле аналогов от OpenAI/Anthropic.
  • 🧱 Для разработчиков — фактически бесплатный тестовый полигон.

Мы наблюдаем классическую компьютеризационную кривую: сначала — закрытые решения, потом — взрыв OSS, который формирует новый стандарт.

🎮 Ролевая игра как двигатель прогресса (да-да, серьёзно)

Вот что стало сюрпризом даже для исследователей:

Roleplay — крупнейшая категория использования OSS-моделей, до 50–60% токенов.

Не программирование (coding).
Не бизнес-аналитика.
Не резюме и не Excel.

А ролевые сценарии, персонажные диалоги, сторителлинг, симуляции поведения, эмоциональные взаимодействия.

Это объясняет, почему:

  • 🧚 миллионы пользователей уходят на open-source RP-модели, а не в ChatGPT;
  • 🎭 OSS-разработчики активно публикуют “persona-tuned” модели;
  • 💬 длина диалогов растёт быстрее, чем сложность задач.

С точки зрения науки об ИИ, это важнее, чем кажется: RP-сценарии создают нагрузку на долговременную память, стилистическую стабильность, многотоновое управление, эмоциональные паттерны — всё, что раньше считалось “нестандартными” задачами.

👨‍💻 Программирование — вторая половина картины

После ролевой игры (roleplay) идёт вторая гигантская категория:

🧱 Programming & IT — более 50% всех токенов к концу 2025 года

Основные задачи:

  • 🛠 анализ чужого кода;
  • 🐞 отладка и устранение ошибок;
  • 🔄 рефакторинг больших проектов;
  • 🎛 генерация конфигураций, Dockerfile, terraform-пайплайнов;
  • 📊 форматирование данных, SQL-запросы, миграции.

Интересно, что:

  • 🟦 Anthropic удерживает лидирующую долю в программировании (60% и выше);
  • 🟥 OpenAI наращивает долю, но медленнее;
  • 🟧 Google остаётся в стабильной нише, но не доминирует;
  • 🟩 OSS-модели приходят в программирование с кодерскими версиями типа Qwen Coder, GPT-OSS-20B.

По сути, LLM впервые становится реально «универсальным компилятором», который умеет интерпретировать, создавать, исправлять и оптимизировать код.

🌍 Мир ИИ теперь действительно глобальный

Статистика по регионам выглядит так:

  • 🇺🇸 США — 47% токенов
  • 🇸🇬 Сингапур — 9.21% (!)
  • 🇩🇪 Германия — 7.51%
  • 🇨🇳 Китай — 6%
  • 🇰🇷 Южная Корея — 2.88%

Рост Азии — невероятный: за год доля выросла с 13% до 31%.

Это связано с:

  • развитием локальных моделей (Qwen, DeepSeek, Kimi K2);
  • снижением доверия к западным API;
  • акселерацией ИИ-проектов и супераппов.

💎 Cinderella Glass Slipper: самый красивый результат исследования

Самый впечатляющий — и философский — раздел отчёта: ретеншен моделей.

OpenRouter обнаружил эффект, который они назвали "Cinderella Glass Slipper" — «эффект стеклянной туфельки».

Суть феномена:

  • когда модель впервые идеально решает ранее невыполнимую задачу,
  • у неё рождается фундаментальная когорта пользователей,
  • которая остаётся с моделью почти навсегда.

💡 Если модель не попала в момент запуска в «вакуум неудовлетворённого спроса» — она не создаёт таких когорт, и рынок её не удерживает.

Примеры:

  • Claude 4 Sonnet — яркая фундаментальная когорта (идеальное сочетание цены, размышления и стабильности).
  • GPT-4o-mini — единственная огромная когорта при запуске, затем плато.
  • Llama 4 Maverick — вообще не создала когорт → модель не “нашла свою туфельку”.

Это потрясающее наблюдение: настоящий прогресс в ИИ измеряется не бенчмарками, а появлением устойчивых когорт пользователей.

⚖️ Цена ≠ использование: рынок ИИ не похож на рынок облаков

Ещё один разрушенный миф:

Снижение цены почти не повышает использование.

Эластичность спроса крайне низкая.

В реальности:

  • 💰 дорогие модели (Claude, GPT-5 Pro) используются очень активно — потому что решают сложные задачи;
  • 🟡 сверхдешёвые модели часто никому не нужны — потому что не дают уникальной ценности;
  • 🟢 “эффективные гиганты” вроде DeepSeek и Gemini Flash показывают лучшие ROI: низкая цена × высокая мощность.

Это значит, что рынок ИИ не движется к полной ценовой конкуренции.
Главное —
качество и модель-маркет-фит, а не стоимость токена.

🔚 Куда движется ИИ в 2026 году (личное мнение автора)

По итогам анализа видно следующее:

⭐ ИИ становится слоем инфраструктуры — как интернет или электричество

Нужно не выбирать одну модель, а уметь управлять десятками.

🤖 Основной тип взаимодействия — агентность, не чат

Чистый чат умирает.
Побеждают цепочки инструментов, планирование, анализ больших контекстов.

🧠 Настоящее соревнование — не за точность, а за удержание

Если модель «попала в стеклянную туфельку», она выигрывает целый рынок.

🌐 Мир ИИ больше не западоцентричен

Китайские OSS-модели уже определяют существенную долю глобального прогресса.

👥 Две крупнейшие категории — ролевые игры и программирование

И оба они — это работа с последовательностью и контекстом, а не «писать текст».

🔗 Источники