Обновили программу, а счёт вырос на треть? Всё верно. Она просто стала считать тот же текст на 30–47% дороже.
Знакомая история: выходит новая версия популярной программы, разработчик обещает улучшения, а цена остаётся прежней. Вы обновляетесь, но в конце месяца счёт приходит на 20–30% больше. Ошибки нет. Просто компания нашла хитрый способ поднять цены, не меняя ценник. Именно это произошло с последним обновлением нейросети Claude от компании Anthropic.
Новая версия вышла с громкими заявлениями: мол, стала точнее и лучше следует инструкциям. В документации скромно упомянули, что новый способ обработки текста будет использовать «примерно на 0–35% больше токенов». Для тех, кто не в курсе: токены — это «кирпичики», на которые нейросеть делит текст для анализа. И именно за их количество вы платите. Казалось бы, небольшой разброс. Но независимые замеры показали совсем другую картину.
Маркетинг против математики: как нас заставляют платить больше
Суть фокуса проста: цена за миллион «кирпичиков»-токенов осталась прежней. Но теперь на один и тот же фрагмент текста нейросеть «насчитывает» этих токенов ощутимо больше. Это как если бы тариф на бензин не изменился, но ваша машина после обновления прошивки вдруг начала потреблять на треть больше топлива на том же маршруте.
Разработчик Абхишек Рэй не поверил рекламе и провёл своё исследование. Он просто «скормил» старой и новой версиям Claude одинаковые тексты и замерил, сколько токенов насчитает каждая. Результаты оказались далеки от скромных «0–35%», обещанных в анонсе.
Почему один и тот же текст стал «дороже» на 47%
Эксперимент показал, что подорожание неравномерно. Сильнее всего оно ударило по программистам — основной аудитории продукта.
- Техническая документация на английском: +47% токенов.
- Файлы с программным кодом: +36% токенов.
- Обычный английский текст: +20% токенов.
- Тексты на китайском и японском: рост всего на 1%.
В среднем, при задачах, имитирующих работу программиста, рост затрат составил 32,5%. То есть за ту же самую работу теперь нужно платить почти на треть больше. Причина в том, что новый алгоритм нарезает английский текст и код на более мелкие «кусочки». Чем мельче кусочки, тем больше их общее количество и выше итоговый счёт.
Более того, это изменение «обнуляет» всю экономию от кеширования. Раньше, если вы постоянно отправляли модели один и тот же большой объём данных (например, документацию по проекту), система запоминала его, и вы не платили за него каждый раз. Теперь весь этот кеш бесполезен, и первые сеансы с новой моделью обойдутся ещё дороже, пока он не заполнится заново.
Что мы получаем за эти деньги? Проверяем «улучшенную точность»
Справедливости ради, разработчики не просто так всё поменяли. Они утверждают, что это позволило нейросети «более буквально следовать инструкциям» — то есть реже додумывать за пользователя и точнее выполнять сложные команды. Звучит хорошо, но так ли это на самом деле?
Тот же исследователь прогнал обе модели через специальный тест IFEval от Google. Этот тест проверяет, насколько хорошо нейросеть справляется с чёткими ограничениями вроде «ответь ровно в 10 словах» или «используй слово X дважды».
Результаты есть, но они не впечатляют. Новая модель справилась с тестами лучше всего на 5 процентных пунктов (90% успеха против 85% у старой версии). Это реальное, измеримое улучшение, но его сложно назвать прорывным. Особенно когда на другой чаше весов лежит 30-процентный рост счетов.
Обновляться или нет: холодный расчёт
В сухом остатке мы имеем классический корпоративный манёвр. Под видом технического улучшения пользователям, по сути, продали скрытое повышение цен. Ценник за «кирпичик» тот же, но самих «кирпичиков» в одной и той же задаче стало больше.
Кому это обновление может быть полезно? Вероятно, тем, для кого критически важна максимальная точность в выполнении инструкций, и кто готов за это доплачивать. Если ваша работа зависит от того, выполнит ли модель все четыре пункта из сложного запроса, а не три, то эти +5% точности могут быть для вас решающими.
Для всех остальных переход на новую версию выглядит сомнительно. Если старая вас полностью устраивала, вы не получите кардинально нового качества работы, но гарантированно увидите рост расходов. Это тот редкий случай, когда остаться на «устаревшей» версии — самое прагматичное и экономически верное решение.
Так что за красивым анонсом скрывается банальное повышение цен. А вы готовы платить на треть больше за едва заметное улучшение?
Источник: I Measured Claude 4.7's New Tokenizer. Here's What It Costs You.
🔔 На «КликХаке» мы любим заглядывать в чек после покупки. Подпишитесь, если вам тоже интересно, за что на самом деле вы платите.