АТОМ и REBEL: секретное оружие Кореи против энергетического кризиса ИИ

7 мая7 мая

3 мин

Представьте, что большие языковые модели вроде GPT-4 – это огромные заводы. Их «обучение» (тренировка) – это строительство завода. Но чтобы завод работал и выдавал продукцию (отвечал на ваши вопросы), нужны эффективные станки. Это этап инференса – когда модель уже обучена и ею пользуются миллионы людей. Сейчас эти «станки» часто делают на базе GPU (видеокарт). Но GPU – как швейцарские ножи: умеют многое, но для одной задачи (инференса) работают не идеально, потребляя кучу энергии. Корейская компания Rebellions (основана в 2020 году) решила создать специальные «станки» – нейронные процессоры (NPU), которые заточены именно под инференс. Их цель – сделать ИИ-вычисления быстрыми, дешёвыми и энергоэффективными. В 2024 году Rebellions слилась с Sapeon Korea (дочка SK Telecom) и теперь считается главным национальным ИИ-чипмейкером Южной Кореи. В компании работает ~280 человек, 80% из них – инженеры из SpaceX, Intel, Meta. Оценка стоимости – $1.4 млрд. Обычные GPU тратят много времени и энерги

Оглавление

Rebellions: Почему корейский стартап может стать звездой 2026 года
В чём их технологический секрет
Архитектура dataflow (потоковая) вместо GPU-подхода.

Rebellions: Почему корейский стартап может стать звездой 2026 года

Сейчас эти «станки» часто делают на базе GPU (видеокарт). Но GPU – как швейцарские ножи: умеют многое, но для одной задачи (инференса) работают не идеально, потребляя кучу энергии. Корейская компания Rebellions (основана в 2020 году) решила создать специальные «станки» – нейронные процессоры (NPU), которые заточены именно под инференс. Их цель – сделать ИИ-вычисления быстрыми, дешёвыми и энергоэффективными.

В 2024 году Rebellions слилась с Sapeon Korea (дочка SK Telecom) и теперь считается главным национальным ИИ-чипмейкером Южной Кореи. В компании работает ~280 человек, 80% из них – инженеры из SpaceX, Intel, Meta. Оценка стоимости – $1.4 млрд.

В чём их технологический секрет

Архитектура dataflow (потоковая) вместо GPU-подхода.

Обычные GPU тратят много времени и энергии на перетасовку данных и переключение потоков. Rebellions спроектировала свой чип так, что данные сами «текут» по вычислительным блокам как конвейер. Это снижает задержки и повышает эффективность. Компилятор (специальная программа) прямо «вплетает» граф модели в железо – так почти не бывает простоев.

Память – королева

Современные LLM ограничены не скоростью счёта, а скоростью подачи данных из памяти. Rebellions использует HBM3E (самую быструю память на сегодня) и хитрую организацию, чтобы данные всегда были под рукой. Это даёт терабайты в секунду.

Чиплеты (chiplet) – конструктор из кристаллов

Вместо одного огромного кристалла (который сложно производить) Rebellions делает несколько маленьких «чиплетов»: вычислительный, для памяти, для ввода-вывода и т.д. Они соединяются через стандарт UCIe прямо в одном корпусе.

Плюсы: выше выход годных, проще обновлять отдельные части, можно создавать разные конфигурации (например, для дешёвых устройств вместо HBM использовать обычную LPDDR-память).

Продукты: от ATOM до REBEL-Quad

ATOM – первое поколение, уже в массовом производстве и реальных ЦОД.

Использует GDDR6 (дешевле и доступнее)
PCIe-карты мощностью от 25 до 75 Вт
Отличная производительность на ватт для небольших LLM и сжатых моделей.

REBEL-Quad – флагман 2026 года.

Чиплеты, HBM3E, поддержка моделей с более чем 100 млрд параметров
Многотерабайтная пропускная память и несколько петафлопс вычислений в низкой точности
Энергопотребление значительно ниже, чем у сравнимых GPU
Масштабирование: вертикальное (тесная связка нескольких ускорителей) и горизонтальное (через Ethernet, для распределённого инференса смеси экспертов MoE).

Программное обеспечение – не менее важно

Rebellions следует принципу hardware-software co-design: железо и софт пилят вместе.

Прямая поддержка PyTorch, интеграция с серверами vLLM и Triton.
Компилятор сам оптимизирует граф, слияние операций, квантование.
Для центров данных: виртуализация через SR-IOV, драйверы для Kubernetes – можно запускать NPU в контейнерах как обычные ресурсы.

Системы «под ключ»

Rebellions продаёт не просто чипы, а готовые решения:

PCIe-карты
Сервер RebelServer (5U стойка, 8 карт REBEL-100, каждая SoC из 4 чиплетов)
Всё вместе – проверенная эталонная архитектура, которая быстро разворачивается и меньше болит у интегратора.

Почему это важно прямо сейчас?

Обучение больших моделей останется на GPU (там нужна супергибкость), но инференс – это 90% всех денег в будущем, когда модели будут запущены в миллионах запросов. Именно здесь специализированные NPU вроде Rebellions выигрывают за счёт лучшей производительности на ватт и предсказуемой задержки. Если они успешно выведут на рынок REBEL-Quad, то могут стать серьёзным конкурентом для NVIDIA, AMD и других стартапов.

Rebellions сделала ставку на чиплеты, потоковое исполнение и софт под реальные задачи инференса. И это работает. Первое поколение уже в дата-центрах, второе выходит. Компания – тёмная лошадка, за которой стоит следить в 2026 году.

Ссылка на первоисточник: https://www.allaboutcircuits.com/news/rebellions-the-korean-company-to-watch-in-2026/

Вас также могут заинтересовать:

Три молчаливые революции в биоинженерии, о которых вы не слышали

MIR - Студия разработки умных устройств (Embedded NN Lab)6 мая

$100 млн на «мозг» убийцы: как Scout AI готовит роботов к тотальной автономии

MIR - Студия разработки умных устройств (Embedded NN Lab)2 мая

ИИ требует жертв: ваш ЦОД не готов

MIR - Студия разработки умных устройств (Embedded NN Lab)29 апреля