EdgeCortixделает ставку на чиплеты: ИИ-чип третьего поколения будет не просто быстрым, а гибким
Компания EdgeCortix, известная своими энергоэффективными ИИ-чипами для периферийных вычислений, готовит революцию. В третьем поколении своей архитектуры Sakura она переходит на чиплеты (chiplet) – и это не просто масштабирование производительности, а смена философии.
Генеральный директор Сакья Дасгупта в подкасте EE Times рассказал, почему гибкость становится важнее сырых тераопераций, как их чипы попали в космос с NASA и почему Япония – лучшее место для полупроводниковой компании в 2026 году.
Не просто edge-чип, а ИИ-инференс любой ценой
EdgeCortix – это не «edge AI company» в узком смысле. Это компания, сфокусированная на инференсе (выполнении уже обученных нейросетей). Главная цель – сделать ИИ-обработку быстрее и энергоэффективнее.
Ключевые метрики:
- производительность на доллар (performance per dollar)
- производительность на ватт (performance per watt)
Приоритет №1 – низкая задержка (латентность). Это важно для реального времени: роботы, дроны, промышленные контроллеры.
С самого начала (2019 год) EdgeCortix взяла курс на software first: сначала компилятор и софт, потом под них – чип. Сегодня «software first» стало мейнстримом, но тогда это было смело.
Что внутри Sakura-II: динамический нейроускоритель
Sakura-II(выпущен в 2024 году) – это чип с производительностью 60 TOPS (INT8). Есть одно- и двухчиповые версии, на плате есть DRAM.
Главная фишка – DNA (Dynamic Neural Accelerator):
1. Локализация данных
Все вычисления стараются проводить внутри чипа, не выгружая данные наружу. Это экономит энергию и время.
2. Динамическая вычислительная шина
Все вычислительные элементы (матричные и векторные движки) соединены гибкой шиной. Во время выполнения её можно переконфигурировать:
- синхронизировать все блоки → максимальная производительность
- отключить ненужные блоки → экономия энергии
Это позволяет приближаться к теоретическому потолку TOPS, который большинство чипов никогда не достигает.
3. Смешанная точность (mixed precision)
Одни слои нейросети работают в BF16 (высокая точность), другие – в INT8 или даже 4-битном приближении. Баланс между точностью и скоростью настраивается динамически.
Компилятор Mera: почему софт важнее железа
Компилятор Mera – это не просто драйвер. Это полноценный инструмент для работы с гетерогенными системами.
Edge-рынок очень фрагментирован:
- ARM-процессоры
- x86-боксы
- RISC-V
- разные NPU от разных вендоров
Mera понимает LLVM, ARM Vela, готовится к RISC-V. Он работает с моделями из Hugging Face, поддерживает PyTorch, TensorFlow, ONNX.
Важно: Mera не перекладывает всё на себя. Если в системе уже есть ARM-процессор с собственным компилятором, Mera может отдать часть задач ему. Не нужно изобретать велосипед.
«Мы не заставляем клиентов квантизовать модели нашими инструментами. Хотите загрузить уже квантизованную модель из PyTorch? Пожалуйста».
Космос, радиация и NASA – случайно
Самый неожиданный поворот: чипы EdgeCortix не проектировались для космоса, но NASA всё равно их тестировала.
Оказалось, что конструкторская и софт-устойчивость, заложенная в Sakura-II, позволяет им работать в условиях радиации до 46–50 рад без единого сбоя. Чипы квалифицированы для орбит LEO, GEO и даже для лунных миссий.
Пример: компания iSpace (лунные миссии) строит прототип лунохода и посадочного модуля на базе Sakura-II в связке с Raspberry Pi. Задачи:
- детекция облаков
- сегментация terrain
- мультимодельный инференс на одном чипе
Никакого специального «rad-hard» дизайна – просто хорошая инженерия.
Чиплеты: ставка на гетерогенность
Третье поколение – Sakura-X – будет построено на чиплетах.
Почему чиплеты?
- позволяют масштабировать производительность (до тысяч TOPS)
- дают аппаратную программируемость (микрокодный уровень, как у GPU, но без потери эффективности ASIC)
- поддерживают UCIe – интерфейс, который позволит смешивать чиплеты от разных производителей
EdgeCortix владеет собственной технологией UCIe. Это значит, что их чиплеты смогут «разговаривать» с чиплетами других вендоров в одной системе.
«Мы остаёмся ASIC, но сохраняем программируемость ровно настолько, чтобы можно было компоновать базовые блоки нейросетей в произвольные операции».
В Sakura-X появится поддержка сложных функций вроде tanh, sigmoid, экспонент и логарифмов – то, с чем у многих современных чипов проблемы.
Почему Япония – лучшее место для фаблесс-компании в 2026 году
В 2019 году этот вариант рассматривали со скепсисом, а сейчас – идеальное время.
Почему:
- государственная поддержка глубоких технологий
- доступ к неразводняющему капиталу (non-dilutive capital) – деньги без потери доли
- мало бесфабричных компаний → спрос превышает предложение
- можно строить глобальную компанию (стиль работы – как в Кремниевой долине, английский – общий язык)
Цифры: 40% пайплайна – Япония, 60% – остальной мир (в основном Северная Америка).
При этом производство – на Тайване, разработка – в Японии и Индии. Чистое «транспацифическое сотрудничество».
Где деньги? Промышленность, роботы, аэрокосмос
Основная выручка сегодня – промышленность:
- умные фабрики
- робототехника (социальные роботы с Whisper + LLM/SLM + RAG)
- enterprise: rack-серверы на чипах EdgeCortix вместо чистых GPU
Аэрокосмос и оборона – тоже растут. EdgeCortix стала первой японской компанией, получившей контракт с Defense Innovation Unit (DIU) США.
Итог: чиплеты, гибкость и реальный мир
EdgeCortix не гонится за гигаваттами и тысячами TOPS ради цифр. Их ставка – реальная эффективность в реальных приложениях:
- низкая задержк
- гибкость под любую нейросетевую архитектуру (трансформеры – сегодня, что-то новое – завтра)
- пособность работать там, где другие чипы либо слишком жадные до энергии, либо недостаточно надёжные (космос, оборона, промышленность)
Sakura-X выйдет гораздо раньше, чем думают. И это будет не просто чип. Это будет платформа.
Ссылка на первоисточник: https://www.eetimes.com/podcasts/edgecortix-looks-to-chiplets-for-third-gen-reconfigurable-ai-chip/
Вас также могут заинтересовать: