Недавно по СМИ прошла новость, что китайский разработчик процессоров для нейросетей SOPHGO в январе начал отправлять участникам российского рынка предложения о сотрудничестве и создании совместного продукта на основе их процессора (бренд CVITEC).
Компания предлагает официально поставлять тензорные процессоры для нейронных сетей, а также центральные процессоры собственной разработки на открытой архитектуре RISC-V.
Кстати, в начале октября прошлого 2023-го года свои решения для российской вычислительной техники начал поставлять другой китайский разработчик центральных процессоров — Loongson. Об этом я уже писал в двух своих статьях «Россия переходит с Intel на Loongson? А как же Эльбрусы и Байкалы?» и «Зачем Россия переходит на Loongson? Ложимся под Китай?». Почитайте тоже, интересная информация.
Плюс китайского предложения в том, что эти тензорные процессоры для нейросетей уже имеются в железе и в любом нужном количестве, в то время как российские тензорные процессоры (несколько уже разработанных моделей разных разработчиков) существуют только в ограниченных партиях в виду невозможности произвести их в достаточном количестве на Тайване.
В такой ситуации нам лучше, конечно, чтобы в Китае нашлись бы не поставщики готовых процессоров, а фабрики, готовые производить наши процессоры. Но на безрыбье, как говориться, и рак рыба.
Пока в России нет своих производственных линий хотя бы на 28 нм, пока мы не можем производить свои процессоры крупными сериями на материковом Китае, а также пока существуют ограничения в поставках тензорных процессоров от Nvidia, Intel, AMD и других разработчиков, контролируемых США, видимо, имеет смысл рассмотреть и этот вариант, чтобы не отстать в разработке систем искусственного интеллекта в связи с отсутствием чипов.
Кстати, о серьёзности этой китайской компании, как таковой, свидетельствует то, что в 2021 году (до слияния компании CVITEC с компанией SOPHGO в 2022 году), генеральный директор Xiaomi фактически стал держателем контрольного пакета акций CVITEC с долей в 20,7%. То есть, компания в китайских кругах довольно известная.
Нюансы специализации «железа»
Все решения для ИИ можно грубо разделить на 2 класса: предназначенные для обучения нейросетей (training) и предназначенные для работы с уже обученной моделью в реальных применениях (inference).
«Железо» может быть специализированным как для решения какого-то одного класса задач (training или inference), так может быть универсальным и применяться в обоих случаях (training и inference).
Обучение нейросетей (training) существенно более ёмко в плане вычислений и требует поддержки форматов данных с более высокой точностью, как правило используются вещественные float32 и float16.
Для inference-задач зачастую достаточно меньшего размера данных и как правило применяется целочисленный 8-ми битный формат int8 (и даже бывает int4 или int1).
А какие разработки имеются в России?
Количество российских разработок невелико по сравнению с количеством подобных разработок в мире, да и производительность наших чипов оставляет желать лучшего. Тем не менее, у нас, на удивление, тоже есть несколько разработок.
Module NM6408 (28 нм)
Чип содержит 16 тензорных ядер NMC4 собственной архитектуры NeuroMatrix Core четвёртого поколения и пять стандартных доступных на рынке ядер архитектуры RISC (с сокращенным набором команд) ARM Cortex-A5.
Из них одно ядро — 32-х разрядный универсальный управляющий RISC-процессор, и ещё четыре — по одному на каждый кластер из четырёх тензорных ядер NMC4 (всего 4 кластера).
На базе микропроцессора «Эльбрус-8СВ» и нейросетевого вычислителя, созданного с использованием тензорного микропроцессора NM6408, ещё в 2021-м году создан нейросетевой сервер, у чём я уже писал в своей тогдашней статье:
Elvis Robodeus (16 нм)
Микросхема может использоваться в когнитивных серверах, в задачах обучения нейронных сетей, автономных робототехнических комплексах и мультимедийных приложениях.
Высокопроизводительная микропроцессорная СнК RoboDeus изготавливается по технологии КМОП 16 нм и включает 8-ядерный когерентный кластер CPU MIPS64, кластер на базе 16 DSP-ядер ELcore-50, 4 графических ядра PowerVR Series8XT, кодеки HEVC/H.264, навигационное ядро с поддержкой ГЛОНАСС/GPS/BeiDou/GALILEO и встроенные порты ввода/вывода.
IVA TPU (28 нм)
Компания IVA Technologies разработала специализированный процессор IVA TPU. Это разработка IVA Technologies, которая базируется на результатах собственных исследований нейропроцессоров.
Основой процессоров является блок матричного умножения, который выполняет наиболее ресурсоемкие вычисления со скоростью десятки тысяч операций за такт.
Справедливости ради отмечу, что информация об этом процессоре с сайта разработчика пропала. Свежей информации о продукте нет, хотя на форуме Микроэлектроника-2023 она вполне себе подаёт признаки жизни по теме. Если кто-нибудь владеет несекретной информацией, куда делась разработка, сообщите пожалуйста в комментариях, интересно.
Нейроморфный процессор «Алтай» (28 нм)
Это процессор от компании «Мотив НТ» тоже для ИИ, предназначен для высокоэффективного исполнения импульсных нейронных сетей. Но у него другой принцип действия.
Если обычные тензорные процессоры для нейросетей используют тензоры — многомерные массивы чисел, описывающие преобразования элементов одного линейного пространства в другое, то нейроморфные сразу эмулируют работу нейронов головного мозга.
Заключение
В общем, разработки у нас есть и свои, только вот негде их пока производить в «железе». Ждём, пока решатся китайские фабрики, ну и, конечно, ждём своих фабрик, разработка оборудования для которых продолжается (информацию ищите в подборке моих статей про литографы).
На сегодня всё. Ставьте нравлики, делитесь своими мыслями в комментариях и подписывайтесь на мой канал! Пока! :-)