2096 подписчиков

«Токенмаксинг» — это не стратегия для ИИ

26 апреля26 апр

8 мин

Прежде чем проверять ценник ИИ, выясните, вписывается ли он в бюджет. Эксперты обсуждают реальную стоимость токенов, влияние на ресурсы и риски зависимости от облачных сервисов. — theregister.com Сколько стоит ИИ? Это простой и важный вопрос — ответ на него определит судьбу компаний и сформирует общество. Но это также вопрос, на который невозможно дать содержательный ответ без дополнительного контекста. Один из возможных ответов: «слишком много». По данным Отчета Индекса искусственного интеллекта за 2026 год Стэнфордского института человеко-ориентированного ИИ (Stanford HAI), частные инвестиции в ИИ в США достигли 285,9 млрд долларов в 2025 году. Эти деньги приносят экономическую выгоду, но также создают нагрузку на природные ресурсы, коммунальные службы и сообщества. Как говорится в отчете: «Мощность электропотребления дата-центров ИИ выросла до 29,6 ГВт, что сопоставимо с пиковым спросом штата Нью-Йорк, а годовое потребление воды для инференса GPT-4o может превысить потребности в пит

Сколько стоит ИИ? Это простой и важный вопрос — ответ на него определит судьбу компаний и сформирует общество. Но это также вопрос, на который невозможно дать содержательный ответ без дополнительного контекста.

Один из возможных ответов: «слишком много». По данным Отчета Индекса искусственного интеллекта за 2026 год Стэнфордского института человеко-ориентированного ИИ (Stanford HAI), частные инвестиции в ИИ в США достигли 285,9 млрд долларов в 2025 году. Эти деньги приносят экономическую выгоду, но также создают нагрузку на природные ресурсы, коммунальные службы и сообщества.

Как говорится в отчете: «Мощность электропотребления дата-центров ИИ выросла до 29,6 ГВт, что сопоставимо с пиковым спросом штата Нью-Йорк, а годовое потребление воды для инференса GPT-4o может превысить потребности в питьевой воде 12 миллионов человек».

Затем есть цена для человеческой компетентности, когда навыки атрофируются или не развиваются из-за чрезмерной зависимости от «игровых автоматов» с промптами.

Но это трудно измерить в краткосрочной перспективе. И учитывая нынешнюю незаинтересованность администрации США в регуляторных ограничениях или общественной озабоченности, возможно, проще сосредоточиться на финансовых мелочах, пока правительство и промышленность не будут вынуждены разобраться с гражданским беспокойством.

Можно начать с токена — на данный момент это базовая единица для продажи входных и выходных данных моделей ИИ. Цена токенов сильно волнует разработчиков, использующих подписные планы на ИИ, поскольку провайдеры планов, такие как Anthropic и GitHub, подталкивают клиентов от подписок с субсидированием токенов к потреблению по мере использования (pay-as-you-go).

Деваньш, исследователь машинного обучения, руководитель отдела ИИ в юридическом стартапе Iqidis и основатель группы сообщества ИИ под названием Chocolate Milk Cult, произвел расчеты в статье, опубликованной ранее в этом году. Ответ — около 0,0038 доллара за миллион токенов — в очень специфическом контексте.

Это базовая стоимость инференса на GPU Nvidia H100, арендованном по цене 2,50 доллара в час, который генерирует 185 токенов в секунду при 100-процентной утилизации.

Но, как отмечает Деваньш, никто не работает при 100-процентной утилизации. При 30-процентной утилизации цена составит около 0,013 доллара за миллион токенов; при 10-процентной — около 0,038 доллара за миллион токенов.

В настоящее время Anthropic взимает плату 5 долларов за миллион токенов (ввод) и 25 долларов за миллион токенов (вывод) за свою последнюю модель Opus 4.7. Для Google Gemma 4 26B A4B средневзвешенная цена ввода на момент написания составляет 0,096 доллара за миллион токенов, согласно OpenRouter.

Если вы произведете расчеты для другого оборудования, по другой цене, с другими затратами на электроэнергию, на разных моделях, с разной утилизацией, вы получите разные результаты.

«Если просто посмотреть на то, что лаборатории предоставляют в качестве стоимости через API, это очень хороший сигнал о том, какова стоимость токена для них, для западных лабораторий», — сказал Деваньш в телефонном интервью The Register.

«Некоторые говорят, что Anthropic пытается получить валовую прибыль около пятидесяти процентов. Но на самом деле стоимость токена — это множество переменных, объединенных в одно целое. У вас есть модель, у вас есть исследования, лежащие в основе модели, постоянные обновления моделей, которые люди не видят. Так что вы должны учитывать все это. Это не просто стоимость инференса при одном вызове, что на самом деле не очень хороший способ взглянуть на систему».

Деваньш сказал, что организации, как правило, не фокусируются на конкретной стоимости токенов, потому что они сосредоточены на предоставлении услуги, которую ценят клиенты.

«Во многих юридических работах вы можете переложить расходы на своего клиента, и клиенты не будут жаловаться, потому что они хотят видеть прозрачность в том, что было сделано и как это было сделано», — сказал он. «Так что с этой точки зрения меньше беспокойства о том, сколько это будет стоить, если вы сможете обосновать свои расходы. … Пока вы постоянно способны приносить пользу, я думаю, прогнозирование затрат вызывает меньше беспокойства».

Компании, такие как Meta* и Shopify, попали в заголовки новостей, рассматривая использование токенов как ключевой показатель эффективности, и сотрудники откликнулись, пытаясь продемонстрировать свою ценность за счет активного использования инструментов ИИ. Это может быстро стать дорогостоящим и не сильно повлиять на более значимые бизнес-метрики.

«Коррелирует ли расход токенов напрямую с производительностью?» — спросил Деваньш. «Абсолютно нет. Я очень подробно занимался этим исследованием. … Раньше у вас были строки кода и другие виды глупых метрик производительности, например, сколько слов вы напечатали. Так что это просто последнее в этой эре глупости. Я думаю, менеджеры среднего звена всегда будут пытаться оправдать себя и найти способ ранжировать людей, не прибегая к собственному уму».

Но одна из проблем с LLM, по словам Деваньша, заключается в том, что мы не знаем, как лучше всего их применять. Таким образом, есть потенциальная ценность в поощрении людей тратить токены на случай, если они придумают новые виды рабочих процессов, которые дадут сигналы о том, что работает, а что нет.

Боб Венеро, генеральный директор ИТ-консалтинговой компании Future Tech Enterprise, сообщил The Register, что его компания обычно работает с клиентами из списка Fortune 100, и многие из них запустили проекты ИИ, связанные с большими денежными вливаниями, не продумав, чего они хотят достичь.

Венеро сказал, что когда его компания взаимодействует с клиентами, цель состоит в том, чтобы определить желаемый бизнес-результат, который может включать ИИ, а может и не включать.

Недавняя работа Future Tech с Northrop Grumman действительно включала ИИ — ИТ-бизнес помог внедрить Nvidia Enterprise AI Factory, чтобы помочь оборонной фирме запускать рабочие нагрузки ИИ, связанные с ее проектами.

Венеро отметил, что компании изо всех сил пытаются оценить влияние ИИ в своей среде, измерить рентабельность инвестиций (ROI) и понять, как может быть полезна эта технология.

«Итак, предстоит много предварительной работы, чтобы определить, куда они хотят потратить свои деньги и каков будет результат, особенно когда затраты в 3 раза выше, чем шесть месяцев назад», — сказал он, ссылаясь на «Рамагеддон» — дефицит оперативной памяти из-за бума вычислений ИИ.

Венеро указывает на обязательство OpenAI закупать чипы памяти у Samsung и SK Hynix, а также на переход OEM-производителей, таких как Micron, к памяти с высокой пропускной способностью (HBM) в качестве катализаторов текущего кризиса ОЗУ. По его словам, это усложняет расчеты ROI для развертывания ИИ, поскольку все стало дороже.

Облачные провайдеры могут помочь, предлагая ценообразование на основе потребления, но у него есть некоторые оговорки по этому поводу.

«Я не большой поклонник ИИ вне локальной инфраструктуры (off-prem AI)», — сказал он. «С нашей точки зрения, это немного пугает».

Оставив в стороне проблемы безопасности, Венеро заявил, что риск для производительности, связанный с зависимостью от облака, является существенным для крупных организаций. Он упомянул Microsoft Office 365. «Разве Office 365 когда-нибудь падал?» — спросил он. «Несколько раз. И происходит так много таких сбоев».

Если сбой в облаке обходится компании в тысячу долларов в минуту простоя, по его словам, это может быть приемлемо. «Если это миллион долларов в минуту, вам, вероятно, следует подумать о мерах контроля, которые необходимо внедрить, и это, вероятно, решение для локальной инфраструктуры», — сказал он.

ИИ может усугублять стабильность облака из-за развертывания недостаточно проверенного кода и нагрузки на инфраструктуру, вызванной интенсивным использованием ИИ. Клиенты, по словам Венеро, «абсолютно это видят. А когда они этого не видят, мы их просвещаем».

В свете проблем с мощностью, вызванных внезапной популярностью OpenClaw, Венеро сказал: «Люди внедрили это в свою среду, и это привело к сумасшедшим вещам. Так что определенно необходим разговор об экосистеме, касающийся риска и трех различных столпов риска, связанных с этим».

И, по его словам, гиперскейлеры усугубили проблему, сосредоточившись на скорости в ущерб качеству. «Прямо сейчас идет гонка. Кто победит? Кто заберет больше всего? И все бросают в это все, что у них есть. И это просто вызывает этот невероятный хаос».

«Мы хотим, чтобы наши клиенты сделали шаг назад», — сказал он. «Посмотрите, чего вы хотите достичь и почему. Посмотрите на связанные с этим инвестиции и правильные сроки для этого, а затем измерьте эти результаты».

Вдумчивый и целенаправленный подход к ИИ повышает вероятность того, что проекты ИИ будут внедрены в производство.

Венеро сказал, что среди компаний, которые он видел, до того, как их проинформировали об ИИ, около 15 процентов их прототипов фактически развертывались. С руководством, по его словам, эта цифра составляет около 45 или 50 процентов.

«Это очень зависит от конкретного варианта использования», — сказал он. «И когда у вас есть результаты, к которым вы стремитесь, а затем вы измеряете эти результаты, вы будете успешны. Если нет, если вы занимаетесь ИИ ради самого ИИ, это будет пять процентов».

Возможно, вопрос о том, сколько стоит ИИ, не должен быть первым. Ссылаясь на давление, которое некоторые сотрудники испытывают, чтобы доказать свою ценность, расходуя токены, Венеро сказал, что вопрос должен быть: «Почему? И для чего вы их используете?» ®

Facebook*, Instagram* и WhatsApp* принадлежат компании Meta* Platforms Inc., деятельность которой признана экстремистской и запрещена на территории Российской Федерации.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Thomas Claburn

Оригинал статьи