Перед GTC 2026 у NVIDIA намечается смена курса: компания готовит платформы, где рядом с GPU появятся специализированные ускорители под отдельные этапы инференса. В центре обсуждения — «agentic performance» и железо под агентные нагрузки, которые к 2026 году выходят на первый план. Ключевой сигнал — ожидаемая материализация сделки NVIDIA с Groq. Речь про интеграцию LPU (Language Processing Unit) в стойки и «треи» следующего поколения, а не про очередной «один GPU на всё». По конфигурациям, которые сейчас обсуждают в индустрии, NVIDIA может показать гибридный compute tray для систем Vera Rubin. В нём рядом с GPU появятся LPU от Groq, а связка пойдёт через NVLink Fusion. Смысл простой: разнести этапы инференса по разным типам железа и поднять эффективность «disaggregated inference». ❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО Называют варианты компоновки LPU внутри одного tray: 64, 128 или 256 LPU-модулей. Jensen Huang ранее сравнивал роль соглашения с Groq с тем,
NVIDIA на GTC 2026 готовит гибрид GPU+LPU и новую Feynman
16 марта16 мар
1
3 мин