1. Что вообще происходит к концу 2025 года
К концу 2025-го ситуация такая: спрос на ИИ-мощности в России растёт, модели становятся толще и прожорливее, а доступ к топовым NVIDIA по-прежнему ограничен санкциями и сложной логистикой.
При этом сама NVIDIA не тормозит: на глобальном рынке уже работают H200 и первые Blackwell B200, которые дают кратный прирост скорости обучения и инференса по сравнению с H100 и становятся стандартом де-факто для LLM-кластеров.
Для российского бизнеса это означает простую вещь: «купить пару H200 и забыть о проблеме» — не рабочая стратегия. Нужно смотреть на альтернативы и комбинировать решения.
2. Кто сейчас претендует на роль «замены NVIDIA»
Китай
За последние пару лет в Китае вырос свой пантеон ИИ-ускорителей:
- Huawei Ascend 910C/910D — линейка, которая по характеристикам подбирается к уровню H100/H200 и ориентирована на обучение и инференс больших моделей. Huawei одновременно развивает собственные кластеры Atlas и софт-стек вокруг этих чипов.
- Moore Threads, Biren, Cambricon и другие — выпускают собственные GPGPU и xPU для дата-центров (MTT S4000, BR100/104, MLU-серии и т.п.), фокусируясь на внутреннем рынке.
- Параллельно китайские разработчики моделей выпускают LLM, которые из коробки оптимизированы под отечественные чипы и собственный стек вместо CUDA.
По «сырой» мощности флагманские китайские чипы ещё не всегда догоняют самые новые NVIDIA, но внутри Китая уже формируется полноценная связка «железо + софт + модели», которая постепенно уходит от зависимости от американской экосистемы.
Россия
В России параллельно идут два процесса:
- Поставки NVIDIA и другой западной техники в обход прямых каналов — основа самого топового сегмента, когда речь идёт о суперкомпьютерах и больших кластерах для LLM.
- Развитие отечественных NPU и специализированных чипов — прежде всего для встраиваемых и edge-решений. Российские разработчики продвигают нейропроцессоры для транспорта, промышленности, медицины и госзадач, где критичны реестры, локальное производство и устойчивость к санкциям.
Пока это не конкуренты H100/B200 по чистой производительности, а отдельный слой — «железо для специфических задач и импортозамещения».
3. Почему для бизнеса главный вопрос — не «какой чип лучше», а «что поедет у меня»
Если смотреть на всё это глазами бизнеса в России, картина такая:
- NVIDIA глобально остаётся эталоном по производительности и зрелости софта, особенно на уровне больших кластеров и LLM.
- Китайские решения интересны по цене и доступности, но требуют готовности жить в другой софт-экосистеме и мириться с тем, что многие фреймворки и инструменты под них ещё дозревают.
- Российские NPU подходят под специфические задачи, жёсткие регуляторные требования и сценарии, где критично импортозамещение, но это другой класс проектов с иной экономикой.
Поэтому ключевой вопрос уже давно не звучит как «что мощнее — H100 или Ascend», а как:
«С учётом моих моделей, данных, бюджета, санкционных рисков и требований по хранению — какой набор железа даст максимум производительности за вменяемые деньги и не умрёт через год по части поддержки?»
4. Как мы в MDM Electronics подходим к выбору ускорителей
Наша позиция проста: мы не «болеем за бренд», мы считаем математику под конкретную нагрузку и инфраструктуру клиента.
Что делаем на практике:
- Разбираем задачи, а не только ТЗ по железу.
NLP, компьютерное зрение, классический ML, генеративка, LLM-инференс, дообучение, длинный контекст — под каждый сценарий разные требования к объёму видеопамяти, пропускной способности сети, дисковой подсистеме и итоговой стоимости владения. - Подбираем комбинацию ускорителей.
В реальных проектах это часто не «чистый» стек, а микс:
кластер на H100/H200 или Blackwell там, где критично время обучения;
массовые RTX для прототипов и R&D;
возможные альтернативы вроде AMD или отдельных китайских/отечественных решений под конкретные задачи. - Собираем и тестируем готовые конфигурации под ключ.
Сервер приезжает уже с:
настроенной ОС и драйверами;
установленными ML- и LLM-фреймворками;
базовыми оптимизациями под стек заказчика. - Смотрим не только на пиковую производительность, но и на эксплуатацию 3–5 лет.
Оцениваем:
доступность комплектующих и каналов поставки;
сервис и скорость замены компонентов;
возможность апгрейда: добавление GPU, памяти, хранилища, выход в кластерную конфигурацию.
5. Главный вывод
К концу 2025 года сам по себе вопрос «чем заменить NVIDIA» в российских ИИ-ЦОДах уже некорректен. NVIDIA остаётся ориентиром по мощности и экосистеме, Китай наращивает собственный стек железа и софта, российские производители занимают нишу спецзадач и импортозамещения.
Реальный выбор для бизнеса звучит так:
какое сочетание NVIDIA, китайских и отечественных ускорителей плюс правильная сеть, память и хранение даст нужную скорость моделей при понятном бюджете и минимальных санкционных и эксплуатационных рисках.
Этим мы в MDM Electronics и занимаемся: превращаем зоопарк чипов, архитектур и маркетинговых обещаний в рабочие конфигурации, которые считают ваши модели сейчас — и продолжат это делать в ближайшие годы.