AI-агенты превращают бум нейросетей в первый серьёзный тест на стоимость. Обычный чат-бот отвечает один раз. Агент работает иначе: - планирует задачу - вызывает инструменты - проверяет результат - исправляет ошибки - снова запускает цикл Из-за этого один запрос может съедать не просто в 2 раза больше токенов, а в 10, 50 и даже больше раз, чем обычный ответ модели. Goldman Sachs ждёт, что к 2030 году использование токенов AI-агентами может вырасти в 24 раза. В бычьем сценарии речь идёт о 120 квадриллионах токенов в месяц. Да, стоимость inference на токен может падать на 60-70% в год. Но вопрос теперь не только в цене токена. Главная битва - между продуктивностью агентов и токеновой расточительностью. Uber и Microsoft уже пересматривают дорогие сценарии использования агентов. Microsoft, например, начала отзывать у разработчиков доступ к Claude Code и переводить их на собственный Copilot CLI к 30 июня. https://www.goldmansachs.com/insights/articles/ai-agents-forecast-to-boost-tech