Добавить в корзинуПозвонить
Найти в Дзене

Токен без хозяина: новая экономика, в которой нет ответственного

В вашей компании, скорее всего, есть хозяин у каждой значимой статьи расходов. У капитала – финансовый директор. У людей – HR. У операционных расходов – функциональные руководители. У токена – нет. Не потому что никто не додумался назначить, а потому что токен не попадает ни в одну категорию ресурсов, которыми организации научились управлять за последние сто лет. Токен — это минимальная единица обработки данных для моделей ИИ Стоимость токена за два года упала на 95–99%, а корпоративные расходы на генеративный AI выросли с $11,5 до $37 млрд – в 3,2 раза за двенадцать месяцев. Каждая пятая компания промахивается в прогнозе ИИ-бюджета более чем вдвое. ИИ-компании – те, кто глубже всего в теме, – промахиваются чаще остальных: 36% против 20% по рынку – чем больше экспертизы, тем хуже видимость. Конец эпохи когнитивного дефицита Последние двести лет организационный дизайн строился на одном допущении: интеллектуальный труд – дефицитный ресурс. Иерархии, грейды, системы мотивации, карьерные л

В вашей компании, скорее всего, есть хозяин у каждой значимой статьи расходов. У капитала – финансовый директор. У людей – HR. У операционных расходов – функциональные руководители. У токена – нет. Не потому что никто не додумался назначить, а потому что токен не попадает ни в одну категорию ресурсов, которыми организации научились управлять за последние сто лет.

Токен — это минимальная единица обработки данных для моделей ИИ

Стоимость токена за два года упала на 95–99%, а корпоративные расходы на генеративный AI выросли с $11,5 до $37 млрд – в 3,2 раза за двенадцать месяцев. Каждая пятая компания промахивается в прогнозе ИИ-бюджета более чем вдвое. ИИ-компании – те, кто глубже всего в теме, – промахиваются чаще остальных: 36% против 20% по рынку – чем больше экспертизы, тем хуже видимость.

Конец эпохи когнитивного дефицита

Последние двести лет организационный дизайн строился на одном допущении: интеллектуальный труд – дефицитный ресурс. Иерархии, грейды, системы мотивации, карьерные лестницы – это архитектура управления редкостью. За когнитивные способности боролись, их удерживали, перекупали, нормировали.

Большие языковые модели это допущение делают неверным – по крайней мере, для значительной части задач. Стандартизированный интеллектуальный труд – меморандумы, отчёты, типовой код, аналитические выкладки – уходит в зону структурного избытка. То же самое произошло с физическим трудом после промышленной революции, с информацией после интернета, с дистрибуцией контента после социальных сетей. Каждый цикл обесценивал ресурс, который до этого был дефицитным, – и каждый раз победителями оказывались не те, кто дешевле производил избыточное, а те, кто первым понял, чего теперь стало мало.

С ИИ новый дефицит формируется на двух полюсах. На одном – то, что принципиально не оцифровывается: физический мир, локальный контекст, репутация с историей. На другом – то, что теряет смысл при масштабировании: суждение под давлением, вкус, подотчётность. Эти ресурсы у организаций есть, но они никогда не были предметом систематического управления, потому что не были дефицитными.

Логичный сценарий выглядел бы так: компании автоматизируют избыточное, перераспределяют сэкономленный ресурс в дефицитное, выигрывают цикл, но происходит другое.

Meta нарастила инвестиции в ИИ-инфраструктуру до $125–145 млрд – это удвоение год к году – и одновременно провела сокращение на 8 000 человек. Uber исчерпал годовой токен-бюджет за четыре месяца и приостановил найм. Oracle расстался с 20 тысячами сотрудников, предварительно попросив их описать собственные рабочие процессы – «для улучшения ИИ-инструментов». Это уже замещение, в котором новый ресурс – токены – занимает место старого, не получив организационной инфраструктуры, которая была у людей: ни хозяина, ни KPI, ни планирования отдачи. Структурный избыток когнитивного труда возник раньше, чем способность им управлять.

Парадокс Джевонса в корпоративном исполнении

Стандартная реакция на удешевление ресурса – ожидание экономии. С токенами эта логика не работает, как и с другими дешевеющими ресурсами, и это не аномалия рынка, а классический экономический эффект.

В 1865 году Уильям Стэнли Джевонс зафиксировал: усовершенствование паровых машин не снизило потребление угля в Англии, а многократно увеличило его. Дешевеющий ресурс перестают экономить – его начинают применять там, где раньше применять было нерентабельно. В ИИ-экономике этот эффект работает с необычной силой. После января 2024 года медианный темп снижения стоимости инференс-токена (выдающего информацию) ускорился до 200x в год. Одновременно агентные цепочки – с планированием, обращением к инструментам, многоступенчатым рассуждением – увеличили потребление токенов на задачу в 10–100 раз с конца 2023 года. Reasoning-токены, которые модели генерируют в процессе внутреннего рассуждения, тарифицируются как выходные данные (инференс-токены) и умножают стоимость сложных задач ещё в 10–30 раз.

Zhang и Zhang в академической работе 2026 года называют это «структурным парадоксом Джевонса»: снижение цены на вычислительный интеллект не приводит к более дешёвому выполнению прежних задач – оно приводит к перепроектированию архитектур под принципиально иной уровень потребления. Совокупный спрос становится суперэластичным: каждое удешевление единицы транслируется в рост расходов на уровне системы.

Прямое следствие сформулировал Jensen Huang в 2025 году: токены – это себестоимость, то есть прямые затраты, связанные с производством или приобретением товаров. Не IT-метрика и не строчка в инфраструктурном бюджете. Генерация ответов составляет 80–90% корпоративных ИИ-вычислений. Агентные системы работают непрерывно. Каждое автоматизированное решение сжигает токены. Вопрос не в том, дорогие они или дешёвые, – вопрос в том, кто внутри организации за них отвечает.

Три категории и пустое место между ними

Современная компания умеет управлять тремя типами ресурсов. Капитал проходит через инвестиционные комитеты и амортизируется по правилам. Операционные расходы планируются функциональными бюджетами и контролируются финансовым департаментом. Люди управляются через HR: найм, грейдинг, оценка производительности, расставание.

У каждого ресурса есть хозяин – роль, которая по природе своей несёт ответственность за его стоимость и отдачу.

Токен не попадает ни в одну категорию. Слишком переменный для CapEx. Слишком непрозрачный для стандартного OpEx-планирования: классический IT-бюджет строится на предсказуемых нагрузках и длинных циклах закупок, агентные среды генерируют непредсказуемые всплески с частотой, которую ни один закупочный процесс не успевает обработать. И точно токены – это не люди – хотя по экономическому поведению ближе всего именно к ним.

Один ИИ-агент делает до 50 000 запросов в день, тогда как человек с ИИ-инструментом – около 50. Когда агенты вызывают других агентов, потребление становится экспоненциальным. По своей природе это аналог поведения персонала: непрерывная активность, масштабируемая через делегирование, с затратами, зависящими от качества постановки задачи. Но ни HR, ни финансовый департамент, ни функциональные подразделения по своим функциональным границам токен под управление автоматически не берут.

Возникает то, что я в своей практике называю организационной сиротой: ресурс, значимый для P&L, но не попадающий в зону ответственности ни одной существующей функции. FinOps возникла как дисциплина управления облачными расходами за двадцать лет постепенного роста этой статьи. На осмысление токен-экономики у организаций было восемнадцать месяцев. IDC прогнозирует, что к 2027 году крупнейшие компании столкнутся с ростом недооценённых ИИ-инфраструктурных затрат до 30% – не из-за расточительности, а из-за системной неспособности спрогнозировать расходы нового типа.

Это объясняет историю с Meta, Uber и Oracle – они делают рациональные шаги в логике, у которой нет адресата: сокращают людей с измеримой стоимостью и предсказуемой отдачей и заменяют их ресурсом, у которого ни того, ни другого пока нет.

Инверсия экспертизы

Стандартное предположение об обучающей кривой гласит: чем дольше организация работает с технологией, тем лучше она понимает её стоимость. Данные по ИИ-расходам это допущение инвертируют.

Глубокое внедрение ИИ означает сложные агентные архитектуры – многоступенчатые цепочки, где модели принимают автономные микрорешения: какой инструмент вызвать, сколько итераций выполнить, насколько детально рассуждать перед ответом. Каждое микрорешение генерирует токены, ни одно из них не видно на уровне задачи. Компания видит итоговый счёт, но не видит, какие именно архитектурные выборы его сформировали.

При традиционной автоматизации замена процесса на скрипт давала предсказуемую стоимость. Агентная автоматизация заменяет процесс на систему, которая сама принимает решения о том, сколько усилий потратить. Стоимость становится функцией от поведения системы, а не от заранее определённых параметров.

В нашем собственном проекте автоматизации это стало очевидно на этапе архитектуры. Токен-бюджетирование пришлось включить не как финансовый контроль после факта, а как проектное ограничение, которое определяет допустимую глубину агентных цепочек на каждом типе задач. Без этого ограничения оптимизация по качеству результата автоматически ведёт к оптимизации по потреблению – и второе никак не связано с первым: хороший ответ от модели и дорогой ответ от модели – это часто один и тот же ответ.

Компетенция, которой пока не существует

FinOps Foundation в 2025 году выпустила отдельную сертификацию по управлению ИИ-расходами. Доля организаций, считающих ИИ-расходы активной управленческой задачей, выросла с 31% в 2024 году до 98% в 2026-м. Крупные технологические компании внедряют инструменты наблюдаемости на уровне токенов: видимость потребления в реальном времени, пороги автоматической остановки агентных процессов, распределение расходов по командам.

Но институциональный ответ пока решает задачу видимости, а не задачу governance. Видеть, сколько токенов потребляет цепочка, – необходимо, но недостаточно. Ключевой вопрос – кто принимает решение о допустимом соотношении токенов к ценности результата на уровне конкретной задачи и по каким критериям.

Эта компетенция находится на пересечении экономики процессов, архитектуры агентных систем и операционного управления. Ни одна существующая функция не покрывает её полностью. Компании, которые первыми создадут эту роль явно – с ответственностью, метриками и местом в оргструктуре, – получат структурное преимущество, аналогичное тому, которое получили первые организации, выделившие команды управления облачными расходами в 2010-х.

И здесь есть содержательный поворот, который меняет первоначальную логику. Если новый дефицит формируется на полюсах суждения, подотчётности, вкуса и локального контекста – а именно эти ресурсы определяют, как компания будет управлять токенами на уровне задач, – то роль «хозяина токенов» по своей природе не техническая. Это управленческая позиция, требующая ровно тех компетенций, которые становятся дефицитными.

Компании, которые быстрее всех сокращают людей, чтобы инвестировать в ИИ, рискуют уволить именно тех, кто мог бы научить организацию управлять ИИ экономически.

Парадокс Джевонса в ИИ-экономике необратим: снижение стоимости токена будет транслироваться в рост сложности архитектур и рост совокупного потребления, это условие, в котором придётся работать. Организационная сирота – проблема, которую можно решить, но только если она перестаёт быть невидимой.

Кто в вашей компании отвечает за экономику токенов?