Rubin обещает 10× дешевле токенов — но почему в реальном проде ваши расходы всё равно растут?
NVIDIA в январе 2026 года на CES громко заявила: платформа Vera Rubin даёт до 10 раз ниже стоимость инференса на миллион токенов по сравнению с Blackwell. Звучит как мечта — платишь в 10 раз меньше за каждый запрос к модели, и всё счастливо. Но на практике у многих команд в марте 2026 года картина другая: перешли (или переходят) на Rubin — а счёт за облако или за свой кластер не падает, а иногда даже растёт. Почему так происходит? Разберём по пунктам реальные причины из production-кейсов 2026 года...