До 2022 года компания Nvidia была ведущим производителем графических процессоров (GPU) благодаря активности в сфере майнинга криптовалют. Их видеокарты были популярны, так как обеспечивали необходимую мощность для добычи криптовалют. В марте 2022 года Nvidia остановила продажи в России, а осенью того же года закрыла свой офис в Москве.
Согласно Juniper Research, к середине 2022 года Nvidia контролировала 79% рынка GPU, в то время как AMD владела 20%, а Intel — 1%. Хотя интерес к майнингу снизился, появление Chat GPT в ноябре 2022 года вызвало всплеск интереса к генеративному искусственному интеллекту, в котором GPU нашли новое применение.
Развитие китайского и российского рынков ИИ
По данным 3DCenter, к середине 2024 года Nvidia контролировала уже 88% рынка видеокарт, оставив AMD с 12%. Однако эти цифры отражают только розничный рынок и не учитывают использование GPU в специализированных серверах для искусственного интеллекта, особенно в Китае и России.
Американские санкции против Китая способствовали росту российского рынка ИИ-серверов. В Китае начало активно развиваться производство чипов, и после начала торговой войны в 2018 году некоторые китайские производители обогнали американских по ряду показателей.
ИИ-серверы стали обязательной частью ИТ-инфраструктуры, и уход Nvidia с российского рынка вызвал их дефицит. Однако это стимулировало позитивные изменения. Российские компании начали активно интересоваться ASIC-архитектурой (Application-Specific Integrated Circuit), которая предлагает мощные решения для искусственного интеллекта.
Преимущества ASIC-архитектуры
Подобные чипы и серверы на их базе имеют ряд ключевых преимуществ над стандартными универсальными GPU-решениями общего назначения:
- Оптимизация: повышенная производительность для конкретной задачи
- Эффективность вычислений: более дешевый процесс обработки данных
- Энергоэффективность: значительная экономия энергии
- Бездефицитность: западные санкции сектор не затронули
ASIC-серверы в России стали доступнее и обеспечивают большую мощность и меньшие эксплуатационные расходы по сравнению с универсальными ИИ-серверами.
Специализированные ASIC-вычислители для ускоренного решения задач искусственного интеллекта, называют TPU (Tensor Processing Unit, тензорные процессоры), NPU (Neural Processing Unit, нейронные процессоры) или ИИ-ускорители.
Искусственный интеллект или нейронная сеть — это математическая модель, программа, которая загружена в компьютер. Например, если ее задача – создание изображений, то она выполняет множество одинаковых арифметических операций каждую секунду, чтобы «нарисовать» запрошенную иллюстрацию. Универсальные процессоры могут справиться с такими задачами, но им требуется больше времени и ресурсов.
Если провести аналогию процессоров с художниками, то будет легче понять, как именно каждый из них работает и почему они названы центральными (CPU), графическими (GPU) и тензорными/нейронными (TPU/NPU):
Представьте, что CPU — это универсальный художник, который может работать в любом стиле, GPU — это команда универсалов, которая пишет одновременно несколько частей картины, а TPU/NPU — это мастерская художников, специализирующихся на одном единственном стиле, например, импрессионизме. Такой подход позволяет быстрее и эффективнее создавать шедевры, похожие на работы Дега.
Развитие и решения Softlogic
Российская компания Softlogic поставляет широкую линейку вычислителей именно на T/NPU. При обработке изображений карта Softlogic SC7 на тензорных процессорах существенно превосходит аналог по классу Nvidia Tesla T4 (см. диаграмму).
Softlogic предлагает различные виды ИИ-ускорителей. Самый популярный – PCI-E карта IVS-SC5. В современных серверных решениях устанавливают несколько таких карт, а серверы объединяют в стэк.
Интерес вызывают решения Softlogic и в форм-факторе мини и микро-серверов. Эти компактные устройства в промышленных корпусах работают в широком температурном диапазоне, позволяя реализовывать ИИ-решения в самых разных проектах.
ИИ-минисерверы линейки Softlogic SE6 и SE8 размещаются в стандартной 19″ стойке, существенно сокращая используемое место в высокопроизводительных системах в сравнении с классическими решениями. Стэк из трех таких серверов решает большинство ИИ-задач крупного предприятия.
Все устройства, представленные в линейке Softlogic, поддерживают широкий спектр современных фреймворков: Caffe, Tensorflow, Pytorch, MXNet, Darknet, ONNX, Paddle. Это позволяет легко перейти к новой архитектуре, не переписывая огромные массивы кода.
Будущее российских ИИ-технологий
Санкции и дефицит помогли как Китайскому рынку, так и России расширить технологические возможности и стимулировали рост и инновации в сфере ИИ-серверов, создав основу для технологического суверенитета. Компания Softlogic предлагает российским предприятиям ASIC-серверы с современными тензорными чипами, обеспечивая стабильные цены и высокое качество и помогая предприятиям постепенно обновлять комплектующие и переходить на оптимизированную элементную базу, нивелируя риски, связанные с изменениями на рынке.