20 подписчиков

DeepSeek обвалила цену флагманской модели V4-Pro на 75 процентов и запустила новый виток ценового противостояния на глобальном рынке ИИ

28 апреля28 апр

7 мин

Хангчжоуская лаборатория снова перевернула стол. Если январь 2025 года индустрия запомнила по шоковой презентации R1, то апрель 2026-го войдёт в историю как момент, когда китайский разработчик решил не просто конкурировать ценой, а буквально задавать новые правила игры всему рынку. 27 апреля DeepSeek объявила о промо-скидке 75 процентов на свежий флагман V4-Pro и одновременно урезала стоимость кэшированных запросов в десять раз по всей линейке API. Срок акции до 5 мая, но эффект явно рассчитан на горизонт куда дальше пары недель. Цифры стоит рассмотреть подробно, потому что общая формулировка "минус 75 процентов" слегка маскирует масштаб. Базовая цена V4-Pro до акции составляла 1,74 доллара за миллион входных токенов при промахе кэша и 3,48 доллара за миллион выходных. После применения скидки входные токены обходятся в 0,435 доллара, выходные в 0,87 доллара, а попадание в кэш падает до 0,03625 доллара за тот же миллион. Облегчённая версия V4-Flash живёт по своему прайсу - 0,14 доллара

Оглавление

Что именно изменилось в ценнике и как новые ставки выглядят на фоне американских конкурентов
Кэширование как тихая революция, которую разработчики оценят больше любой громкой акции
Архитектурная начинка V4-Pro и где модель действительно дышит конкурентам в спину

Что именно изменилось в ценнике и как новые ставки выглядят на фоне американских конкурентов

Цифры стоит рассмотреть подробно, потому что общая формулировка "минус 75 процентов" слегка маскирует масштаб. Базовая цена V4-Pro до акции составляла 1,74 доллара за миллион входных токенов при промахе кэша и 3,48 доллара за миллион выходных. После применения скидки входные токены обходятся в 0,435 доллара, выходные в 0,87 доллара, а попадание в кэш падает до 0,03625 доллара за тот же миллион. Облегчённая версия V4-Flash живёт по своему прайсу - 0,14 доллара за вход и 0,28 за выход.

Для сравнения: даже стандартная цена V4-Pro до акции уже подрезала GPT-5.5 от OpenAI, Gemini 3.1 Pro от Google и Claude Opus от Anthropic. По одной из аналитических оценок, китайские модели сейчас работают по тарифам в четыре-шесть раз ниже американских аналогов. Промо-скидка делает разрыв почти неприличным. Любой разработчик, считающий бюджет на инференс, получает повод как минимум открыть калькулятор, а как максимум переписать архитектуру под новый API.

Кэширование как тихая революция, которую разработчики оценят больше любой громкой акции

Десятикратное удешевление кэшированных входных запросов выглядит скромнее на афише, но по сути это и есть главный технический сдвиг. Кэш срабатывает там, где модель получает повторяющиеся или почти идентичные запросы - типичная ситуация для чат-ботов с длинными системными промтами, для агентов, многократно перечитывающих документ, для RAG-систем со стабильным контекстом.

Раньше попадание в кэш стоило 0,145 доллара за миллион токенов. Теперь 0,025 юаня за миллион, что в пересчёте даёт примерно 0,0036 доллара. Разница ощущается буквально в счетах за конец месяца. Для стартапов, гоняющих сотни миллионов токенов в день через стандартизированные пайплайны, это разница между "проект выживает" и "проект масштабируется без раунда инвестиций".

Логика DeepSeek прозрачна. Дорогие модели тормозят переход от пилотов к продакшену. Снимаешь ценовой барьер - получаешь кратный рост использования и заодно прирост обучающих данных через обратную связь. Долгосрочно это полезнее, чем держать высокую маржу на узкой аудитории.

Архитектурная начинка V4-Pro и где модель действительно дышит конкурентам в спину

V4-Pro построена по схеме mixture-of-experts с общим размером 1,6 триллиона параметров, из которых одновременно активны 49 миллиардов. V4-Flash скромнее - 284 миллиарда параметров суммарно при 13 миллиардах активных. Обе версии поддерживают контекстное окно в один миллион токенов, чего хватает для разбора крупных кодовых баз, юридических архивов или технической документации за один прогон.

Модель оптимизирована под Huawei Ascend, а не под привычный Nvidia, и это принципиальный момент. DeepSeek сознательно встраивает себя в китайскую полупроводниковую вертикаль, снижая зависимость от экспортных ограничений США. По заявлению компании, V4-Pro показывает лучший результат среди открытых моделей в тестах на знания о мире и уступает только проприетарной Gemini 3.1 Pro от Google. Сами разработчики честно признают: до GPT-5.4 и Gemini 3.1 Pro по общей производительности отставание сохраняется и оценивается в три-шесть месяцев. Но в задачах для ИИ-агентов модель чувствует себя увереннее, а её эффективность выросла заметно - V4-Pro требует всего 27 процентов вычислительной мощности предшественника V3.2 при работе с миллионным контекстом.

Интеграция с западной экосистемой и почему миграция на DeepSeek стала технически почти бесшовной

Самое интересное даже не цена и не контекст, а то, что V4-Pro нативно подключается к Claude Code, OpenClaw и OpenCode - трём ведущим агентским фреймворкам, которыми пользуется западное сообщество. То есть разработчик, привыкший к Anthropic или OpenAI, не должен переписывать инструментарий с нуля. Достаточно поменять эндпоинт и ключ.

Барьер переключения растворяется. Когда инженер в Сан-Франциско или Бангалоре сравнивает счёт за инференс и видит шестикратную разницу при сопоставимом качестве, дальнейшее обсуждение превращается в формальность. Сооснователь индийского медтех-стартапа O-Health Акшар Керемане в комментарии Bloomberg сформулировал это просто: сочетание цены, открытого кода и миллионного контекста снижает порог входа для разработчиков, стартапов и небольших компаний. Его команда внедряет ИИ в крупных больницах и сельских клиниках при поддержке Фонда Гейтса, и подобная финансовая доступность ускоряет реальное применение технологий.

Геополитический фон и тонкий стратегический расчёт, в который DeepSeek встроила своё снижение цен

Скидка приземлилась в очень конкретный момент. За день до релиза V4 директор по научно-технической политике Белого дома Майкл Кратсиос подписал меморандум о борьбе с дистилляцией американских моделей иностранными игроками. Имя DeepSeek в документе не звучало напрямую, но обвинения в использовании выходов GPT и Claude для обучения собственных моделей хангчжоуская компания получала и от OpenAI, и от Anthropic.

Ответ DeepSeek оказался демонстративно немногословным. Вместо опровержений и пресс-релизов - резкое снижение цены через три дня после меморандума. Жест читается однозначно: китайский игрок не собирается оправдываться, он собирается побеждать на поле, где у американских лабораторий нет встроенного преимущества. Дешёвый инференс становится политическим аргументом не хуже официального заявления.

При этом китайские открытые модели уже глубоко проросли в американскую экосистему. По некоторым оценкам, они присутствуют примерно в 80 процентах американских ИИ-стартапов, доступны через Amazon, Microsoft и Google Cloud, встроены в инструменты для разработчиков и облачные маркетплейсы. Вытеснить их административными мерами практически невозможно - корни уже слишком глубокие.

Что произойдёт с рынком и как поведут себя OpenAI, Anthropic и Google в ближайшие месяцы

История повторяется по знакомому сценарию. После запуска R1 в начале 2025 года американские игроки запустили волну снижений тарифов: OpenAI несколько раз правила прайс на API, Anthropic ввела многоуровневое ценообразование для разных размеров Claude, Google поэтапно удешевлял Gemini. Реакция на текущий ход DeepSeek почти неизбежна - вопрос лишь в том, насколько глубоким окажется ответ.

Последствия для индустрии можно сформулировать через несколько ключевых сдвигов:

Себестоимость инференса для конечного пользователя продолжает падать, и это открывает дорогу проектам, которые год назад были экономически нежизнеспособны;
Граница между премиальными и массовыми моделями размывается, потому что качество догоняет, а цена обрушивается;
Конкуренция смещается из области бенчмарков в область тулинга, интеграций и удобства разработчика;
Геополитика всё плотнее вплетается в технические решения, и выбор модели становится не только бюджетным, но и стратегическим вопросом;
Открытые веса китайского происхождения окончательно закрепляются как массовый стандарт.

Бизнесу всё это даёт окно возможностей. Те, кто откладывал внедрение ИИ из-за стоимости, получают шанс пересмотреть планы без оглядки на инвестиционный раунд. Те, кто уже строил решения на дорогих API, могут хотя бы протестировать миграцию и сэкономить значительную часть операционного бюджета. Главное - не путать удешевление с упрощением. Качество промтинга, архитектура агентов, проверка результатов остаются на стороне команды, и никакая скидка эту работу не отменяет.

Главный вывод, который стоит вынести из апрельского хода DeepSeek

Картина складывается любопытная. Китайский игрок, ещё недавно воспринимавшийся как догоняющий, диктует темп всей отрасли и заставляет лидеров пересматривать бизнес-модель. Промо-акция закончится 5 мая, но сама логика - "флагманский ИИ должен стоить дёшево" - уже не уйдёт. Эта планка задана, и каждый следующий релиз конкурентов будут мерить по ней.

Для разработчиков и предпринимателей наступает редкое время, когда технологический потолок поднимается, а финансовый пол одновременно опускается. Что между ними поместится - зависит уже не от прайс-листа, а от смелости тех, кто решит этим воспользоваться.

https://fileenergy.com/raznoe