Найти в Дзене

Новый 3D-чип может сломать главное узкое место ИИ

Монолитная вертикальная интеграция памяти и логики обещает кратный рост производительности и энергоэффективности ИИ-ускорителей. Межуниверситетская команда инженеров из Стэнфордского университета, Университета Карнеги — Меллона, Пенсильванского университета и Массачусетского технологического института представила прототип монолитного 3D-чипа, способного радикально ускорить работу систем искусственного интеллекта. В отличие от традиционных плоских микросхем, новая архитектура вертикально объединяет память и вычислительные блоки, устраняя ключевое ограничение современного ИИ-железа — «стену памяти». Проект был реализован совместно с компанией SkyWater Technology, крупнейшим независимым полупроводниковым производством полного цикла в США. Это делает разработку не только академическим экспериментом, но и демонстрацией технологической готовности к промышленному выпуску. Почему ИИ упирается в «стену памяти» Современные модели ИИ — от ChatGPT до Claude — непрерывно перемещают огромные массивы

Монолитная вертикальная интеграция памяти и логики обещает кратный рост производительности и энергоэффективности ИИ-ускорителей.

Межуниверситетская команда инженеров из Стэнфордского университета, Университета Карнеги — Меллона, Пенсильванского университета и Массачусетского технологического института представила прототип монолитного 3D-чипа, способного радикально ускорить работу систем искусственного интеллекта. В отличие от традиционных плоских микросхем, новая архитектура вертикально объединяет память и вычислительные блоки, устраняя ключевое ограничение современного ИИ-железа — «стену памяти».

Проект был реализован совместно с компанией SkyWater Technology, крупнейшим независимым полупроводниковым производством полного цикла в США. Это делает разработку не только академическим экспериментом, но и демонстрацией технологической готовности к промышленному выпуску.

Почему ИИ упирается в «стену памяти»

Современные модели ИИ — от ChatGPT до Claude — непрерывно перемещают огромные массивы данных между памятью и вычислительными узлами. В классических 2D-чипах память и логика размещены на одной плоскости, а каналы передачи данных:

  • длинные;
  • ограниченные по количеству;
  • перегруженные.

В результате вычислительные блоки простаивают, ожидая данные, а рост производительности упирается не в скорость транзисторов, а в пропускную способность межсоединений. Это явление известно как memory wall — «стена памяти».

Долгое время индустрия обходила проблему за счёт миниатюризации транзисторов. Однако этот путь подходит к физическим пределам — так называемой «стене масштабирования».

Архитектура, которая строится вверх

Новый чип принципиально меняет подход. Вместо дальнейшего «уплотнения по плоскости» исследователи перешли к вертикальной интеграции:

  • сверхтонкие слои памяти и логики укладываются друг над другом;
  • между слоями создаётся рекордно плотная сеть вертикальных соединений;
  • расстояние между памятью и вычислениями сокращается на порядки.

Авторы сравнивают архитектуру с высотным зданием: если 2D-чип — это одноэтажный склад с узкими коридорами, то 3D-чип — это небоскрёб с десятками скоростных лифтов.

«Интегрируя память и вычисления вертикально, мы можем перемещать гораздо больше информации гораздо быстрее», — объясняет Татхагата Шримани, доцент Университета Карнеги — Меллона и старший автор работы.

Монолитная 3D-интеграция вместо «склейки чипов»

Ранее 3D-чипы чаще всего создавались путём соединения уже готовых кристаллов. Такой подход упрощает производство, но оставляет узкие места:

  • ограниченное число межслойных контактов;
  • высокие задержки;
  • энергетические потери.

В новой работе применена монолитная 3D-интеграция: каждый слой формируется непосредственно поверх предыдущего в рамках единого технологического процесса. Для этого используются низкотемпературные этапы, не повреждающие нижележащие схемы.

Именно этот метод позволил:

  • добиться высокой плотности вертикальных соединений;
  • устранить межслойные «бутылочные горлышки»;
  • сохранить совместимость с промышленным производством.

Реальная производительность, а не только теория

В аппаратных тестах прототип:

  • показал примерно четырёхкратный прирост производительности по сравнению с сопоставимыми 2D-чипами;
  • в симуляциях масштабирования архитектуры демонстрирует до 12-кратного ускорения на реальных ИИ-нагрузках, включая модели семейства LLaMA.

Кроме чистой скорости, архитектура даёт значительный выигрыш по energy–delay product (EDP) — ключевой метрике для ИИ-ускорителей. По оценкам команды, в перспективе возможны улучшения в 100–1000 раз, что ранее считалось практически недостижимым без технологического скачка.

Производство в США как стратегический фактор

Отдельный акцент авторы делают на том, что весь чип был изготовлен на коммерческом американском заводе, а не в экспериментальной лаборатории.

«Это доказывает, что продвинутые 3D-архитектуры возможны не только в научных публикациях — их можно масштабно производить внутри страны», — подчёркивает Марк Нельсон, вице-президент SkyWater Technology.

Для США это означает:

  • снижение зависимости от зарубежных фабрик;
  • ускорение цикла «идея → кремний»;
  • формирование нового поколения инженеров, ориентированных на 3D-интеграцию.

Что это меняет для будущего ИИ

Исследователи подчёркивают: значимость работы выходит за рамки одной архитектуры. Переход к вертикальной, монолитной 3D-интеграции:

  • открывает путь к масштабированию ИИ-систем без экстремального энергопотребления;
  • позволяет преодолеть сразу две фундаментальные стены — памяти и миниатюризации;
  • формирует основу для следующего поколения ИИ-ускорителей.

«Это не только про производительность, но и про способность быстро внедрять инновации и формировать будущее аппаратного обеспечения ИИ», — резюмирует профессор Стэнфорда Х.-С. Филип Вонг.

Источник: https://www.sciencedaily.com/releases/2025/12/251223084857.htm

Больше интересного – на медиапортале https://www.cta.ru/