В последнее время у меня вышло несколько постов и статей на тему искусственного интеллекта и нейросетевых моделей. Так, я рассказал о двух китайских моделях Qwen и Deepseek-К1 в статях:
В комментариях были вопросы по поводу того, а где же наша отечественная разработка, такая, «чтобы уронить капитализацию NVidia на сотни миллиардов»? У нас есть модели от Сбера (GigaChat) и Яндекса (YandexGPT), но в них ничего такого прорывного, как было, скажем, у китайской Deepseek-R1. Модель от Яндекса вообще выглядит очень слабо.
У нас, как обычно, в основе — открытое ПО и просто попытка некоторой адаптации (с переменным успехом) наборов данных, на которых проходит обучение, под российскую специфику.
Что касается железа, то работают наши модели на NVidia, которые были закуплены ещё до санкций. Помню, Сбер очень много закупал в своё время. А что же у нас с нашим «железом»?
В начале 2024 года я написал статью «Китайский разработчик тензорных процессоров для ИИ предложил их российским производителям», в которой вкратце перечислил все нейропроцессоры, которые разработаны в России. Это микросхемы К1879ВМ8Я от НТЦ «Модуль», Elvis Robodeus от АО НПЦ «ЭЛВИС» и IVA TPU от IVA Technologies. Также есть нейроморфный процессор «Алтай» от компании «Мотив НТ». То есть, что-то уже есть, но реально тягаться с NVidia эти разработки не могут.
В конце 2021-го года в своей статье «Новый нейросетевой процессор создадут для Минобороны, ОКР профинансирован!» я писал об одном интересном ОКР на новый нейросетевой процессор (шифр «Процессор-23»). Согласно плану, процессор должен быть разработан до 30 ноября 2025-го года, как развитие уже имеющегося процессора К1879ВМ8Я.
Так вот, на днях в СМИ появилось подтверждение, что всё идёт по плану, и в третьем-четвёртом квартале 2025 года такой процессор (под кодовым названием «Арамис») уже появится. Более того, было анонсировано, что следующей разработкой станет более мощный серверный нейропроцессор, который уже будет вполне похож на те самые NVidia, стоящие в их 300-ваттных модулях.
Летом этого года ожидается приход с фабрик первых MVP-образцов нейропроцессора «Арамис».
MVP (Minimum Viable Product) или Минимально Жизнеспособный Продукт — это самая ранняя версия продукта, у которой есть минимальный набор функций, достаточный для презентации публике и проверке на первых потребителях.
Справедливости ради, стоит заметить, что по плану опытные образцы этого процессора должны были появиться уже в конце 2024 года. Но эта сдвижка в полгода, судя по всему, не повлияет на ожидаемую дату окончания работ.
Вкратце о процессоре
Целью ОКР, заявленной в 2021 году, является разработка на базе отечественной архитектуры NeuroMatrix гетерогенной многопроцессорной системы на кристалле, предназначенной для решения методами нейросетевой обработки данных широкого круга задач, таких как распознавание образов, управление беспилотными транспортными средствами, цифровая обработка аудио и видео сигналов.
Разрабатываемая микросхема не имеет отечественных и прямых зарубежных аналогов и представляет собой косвенный аналог микросхемы NVIDIA Jetson Xavier 2018-го года, предназначенной для встраиваемых вычислительных плат.
Хотя процессор Арамис не предназначен именно для обучения нейросетей (на это будет больше рассчитан следующий мощный серверный нейропроцессор), но он будет максимально близок к обучению нейросетей из того, что сегодня есть на российском рынке.
Согласно ОКР, в состав микросхемы входят:
- управляющая процессорная система, содержащая не менее двух процессорных кластеров с суммарным количеством процессорных ядер – не менее 8. По факту, как и на предыдущей версии микросхемы, это мощные ядра ARM 7-го поколения (очевидно, те же Cortex-A5). Но теперь они позволяют отказаться от внешнего процессора, как хостового.
- нейросетевой ускоритель, содержащий не менее 8 нейропроцессорных ядер архитектуры NMC5. Новая версия архитектуры содержит не просто векторно-матричные АЛУ, как это было в предыдущей версии. NMC5 — это полноценный нейросетевой ускоритель с блоком пуллинга, блоком переупаковки данных, блоком свёртки, блоком мультимодальных данных (обработки голоса и т.п.) и т.д.
- ядро расчета карт диспаратности (Stereo Vision);
- подсистема обработки графической информации;
- ядро видеокодека кодер/декодер;
- ядро предобработки видеосигналов (Image Signal Processing);
- интерфейс с внешней оперативной памятью (требовалась поддержка LPDDR4, но по факту будет поддерживаться LPDDR5);
- подсистема прямого доступа к памяти;
- контроллеры PCI Express (требовалась не ниже 3.0, по факту будет 5.0);
- контроллеры периферийных устройств:
- два контроллера Ethernet 10/100/1000 (w. IEEE 1588);
- два контроллера 10G Ethernet;
- два контроллера MIPI CSI-2 RX x4;
- контроллер DisplayPort;
- контроллер USB3.0;
- восемь контроллеров I2C;
- контроллер I2S;
- четыре контроллера CAN 2.0;
- контроллер SD Card/SDIO;
- шесть контроллеров SPI;
- два контроллера QSPI;
- девять контроллеров UART;
- не менее тридцати двух линий GPIO;
- контроллер JTAG.
Несмотря на то, что производительность нового процессора будет в разы выше, чем у предыдущего К1879ВМ8Я, разработчики обещают оставить энергопотребление на прежнем уровне — не более 15 Вт. Напомню что типовая потребляемая мощность К1879ВМ8Я — 12 Вт, а максимальная потребляемая мощность — 35 Вт.
Техпроцесс, вероятно, остаётся на уровне 28 нм (фабрика неизвестна), то есть, весь прирост производительности ожидается за счёт совершенствования архитектуры. Стоимость нового микропроцессора за счёт гораздо большей серии ожидается сравнимой со стоимостью К1879ВМ8Я.
Заключение
Констатируем, что работы по нейросетям ведутся не только в области программного обеспечения и подготовки наборов данных, но и в области аппаратного обеспечения. Замечу, что помимо микропроцессоров, НТЦ «Модуль» делает и модули различного назначения на их основе.
Подробнее про новый процессор и другие ожидающиеся изделия можно послушать в интервью с представителем разработчика.
На сегодня всё. Ставьте нравлики, делитесь своим мнением в комментариях и не забудьте подписаться на мой канал, если вы этого ещё не сделали. Удачи! :-)