Добавить в корзинуПозвонить
Найти в Дзене

АТОМ и REBEL: секретное оружие Кореи против энергетического кризиса ИИ

Представьте, что большие языковые модели вроде GPT-4 – это огромные заводы. Их «обучение» (тренировка) – это строительство завода. Но чтобы завод работал и выдавал продукцию (отвечал на ваши вопросы), нужны эффективные станки. Это этап инференса – когда модель уже обучена и ею пользуются миллионы людей. Сейчас эти «станки» часто делают на базе GPU (видеокарт). Но GPU – как швейцарские ножи: умеют многое, но для одной задачи (инференса) работают не идеально, потребляя кучу энергии. Корейская компания Rebellions (основана в 2020 году) решила создать специальные «станки» – нейронные процессоры (NPU), которые заточены именно под инференс. Их цель – сделать ИИ-вычисления быстрыми, дешёвыми и энергоэффективными. В 2024 году Rebellions слилась с Sapeon Korea (дочка SK Telecom) и теперь считается главным национальным ИИ-чипмейкером Южной Кореи. В компании работает ~280 человек, 80% из них – инженеры из SpaceX, Intel, Meta. Оценка стоимости – $1.4 млрд. Обычные GPU тратят много времени и энерги
Оглавление

Rebellions: Почему корейский стартап может стать звездой 2026 года

Представьте, что большие языковые модели вроде GPT-4 – это огромные заводы. Их «обучение» (тренировка) – это строительство завода. Но чтобы завод работал и выдавал продукцию (отвечал на ваши вопросы), нужны эффективные станки. Это этап инференса – когда модель уже обучена и ею пользуются миллионы людей.

Сейчас эти «станки» часто делают на базе GPU (видеокарт). Но GPU – как швейцарские ножи: умеют многое, но для одной задачи (инференса) работают не идеально, потребляя кучу энергии. Корейская компания Rebellions (основана в 2020 году) решила создать специальные «станки» – нейронные процессоры (NPU), которые заточены именно под инференс. Их цель – сделать ИИ-вычисления быстрыми, дешёвыми и энергоэффективными.

В 2024 году Rebellions слилась с Sapeon Korea (дочка SK Telecom) и теперь считается главным национальным ИИ-чипмейкером Южной Кореи. В компании работает ~280 человек, 80% из них – инженеры из SpaceX, Intel, Meta. Оценка стоимости – $1.4 млрд.

В чём их технологический секрет

Архитектура dataflow (потоковая) вместо GPU-подхода.

Обычные GPU тратят много времени и энергии на перетасовку данных и переключение потоков. Rebellions спроектировала свой чип так, что данные сами «текут» по вычислительным блокам как конвейер. Это снижает задержки и повышает эффективность. Компилятор (специальная программа) прямо «вплетает» граф модели в железо – так почти не бывает простоев.

Память – королева

Современные LLM ограничены не скоростью счёта, а скоростью подачи данных из памяти. Rebellions использует HBM3E (самую быструю память на сегодня) и хитрую организацию, чтобы данные всегда были под рукой. Это даёт терабайты в секунду.

Чиплеты (chiplet) – конструктор из кристаллов

Вместо одного огромного кристалла (который сложно производить) Rebellions делает несколько маленьких «чиплетов»: вычислительный, для памяти, для ввода-вывода и т.д. Они соединяются через стандарт UCIe прямо в одном корпусе.

Плюсы: выше выход годных, проще обновлять отдельные части, можно создавать разные конфигурации (например, для дешёвых устройств вместо HBM использовать обычную LPDDR-память).

Продукты: от ATOM до REBEL-Quad

ATOM – первое поколение, уже в массовом производстве и реальных ЦОД.

  • Использует GDDR6 (дешевле и доступнее)
  • PCIe-карты мощностью от 25 до 75 Вт
  • Отличная производительность на ватт для небольших LLM и сжатых моделей.

REBEL-Quad – флагман 2026 года.

  • Чиплеты, HBM3E, поддержка моделей с более чем 100 млрд параметров
  • Многотерабайтная пропускная память и несколько петафлопс вычислений в низкой точности
  • Энергопотребление значительно ниже, чем у сравнимых GPU
  • Масштабирование: вертикальное (тесная связка нескольких ускорителей) и горизонтальное (через Ethernet, для распределённого инференса смеси экспертов MoE).

Программное обеспечение – не менее важно

Rebellions следует принципу hardware-software co-design: железо и софт пилят вместе.

  • Прямая поддержка PyTorch, интеграция с серверами vLLM и Triton.
  • Компилятор сам оптимизирует граф, слияние операций, квантование.
  • Для центров данных: виртуализация через SR-IOV, драйверы для Kubernetes – можно запускать NPU в контейнерах как обычные ресурсы.

Системы «под ключ»

Rebellions продаёт не просто чипы, а готовые решения:

  • PCIe-карты
  • Сервер RebelServer (5U стойка, 8 карт REBEL-100, каждая SoC из 4 чиплетов)
  • Всё вместе – проверенная эталонная архитектура, которая быстро разворачивается и меньше болит у интегратора.

Почему это важно прямо сейчас?

Обучение больших моделей останется на GPU (там нужна супергибкость), но инференс – это 90% всех денег в будущем, когда модели будут запущены в миллионах запросов. Именно здесь специализированные NPU вроде Rebellions выигрывают за счёт лучшей производительности на ватт и предсказуемой задержки. Если они успешно выведут на рынок REBEL-Quad, то могут стать серьёзным конкурентом для NVIDIA, AMD и других стартапов.

Rebellions сделала ставку на чиплеты, потоковое исполнение и софт под реальные задачи инференса. И это работает. Первое поколение уже в дата-центрах, второе выходит. Компания – тёмная лошадка, за которой стоит следить в 2026 году.

Ссылка на первоисточник: https://www.allaboutcircuits.com/news/rebellions-the-korean-company-to-watch-in-2026/

Вас также могут заинтересовать:

$100 млн на «мозг» убийцы: как Scout AI готовит роботов к тотальной автономии
MIR - Студия разработки умных устройств (Embedded NN Lab)2 мая
ИИ требует жертв: ваш ЦОД не готов
MIR - Студия разработки умных устройств (Embedded NN Lab)29 апреля