Найти в Дзене
DigiNews

NVIDIA может наконец отказаться от концепции «один GPU для всего» на GTC 2026: чего ждать от компании

Приближаемся к GTC 2026: ожидается сдвиг в восприятии вычислений ИИ. NVIDIA, вероятно, представит гибридные системы с LPU Groq в Vera Rubin и углубится в архитектуру Feynman с 3D-стекированием и техпроцессом TSMC A16. — wccftech.com Мы приближаемся к GTC 2026, одному из важнейших событий в мире ИИ, и в этом году мы ожидаем масштабного сдвига в восприятии вычислений. Гонка за инфраструктурой ИИ значительно изменилась за последние несколько лет, поскольку растущие требования к вычислительным мощностям вынудили такие компании, как NVIDIA и AMD, внедрять инновации в свои предложения. С 2022 года мы наблюдаем огромную популярность рабочих нагрузок обучения, на которых Hopper и Blackwell смогли преуспеть. Теперь, вступая в 2026 год, агентские рабочие нагрузки становятся следующей областью внимания для поставщиков вычислительных ресурсов, поэтому предстоящие анонсы NVIDIA на GTC будут посвящены именно им. Вы много услышите о «производительности агентских систем», и «Зеленая команда» стратегич
Оглавление

Приближаемся к GTC 2026: ожидается сдвиг в восприятии вычислений ИИ. NVIDIA, вероятно, представит гибридные системы с LPU Groq в Vera Rubin и углубится в архитектуру Feynman с 3D-стекированием и техпроцессом TSMC A16. — wccftech.com

Мы приближаемся к GTC 2026, одному из важнейших событий в мире ИИ, и в этом году мы ожидаем масштабного сдвига в восприятии вычислений.

Гонка за инфраструктурой ИИ значительно изменилась за последние несколько лет, поскольку растущие требования к вычислительным мощностям вынудили такие компании, как NVIDIA и AMD, внедрять инновации в свои предложения. С 2022 года мы наблюдаем огромную популярность рабочих нагрузок обучения, на которых Hopper и Blackwell смогли преуспеть. Теперь, вступая в 2026 год, агентские рабочие нагрузки становятся следующей областью внимания для поставщиков вычислительных ресурсов, поэтому предстоящие анонсы NVIDIA на GTC будут посвящены именно им. Вы много услышите о «производительности агентских систем», и «Зеленая команда» стратегически позиционировала себя.

Сделка NVIDIA и Groq готова материализоваться: GTC 2026 станет первым признаком отхода от вычислений, основанных исключительно на ГП

Нам удалось сохранить лидерство в обсуждении приобретения Groq компанией NVIDIA, будучи одними из первых, кто заговорил о важности этого соглашения для мира вычислений. Ожидается, что на GTC 2026 NVIDIA материализует свое сотрудничество с Groq в реальный конечный продукт, и одним из перспективных направлений, которое мы надеемся увидеть, является сочетание блоков LPU от Groq с системами Vera Rubin от NVIDIA. Ожидается, что с Vera Rubin «Зеленая команда» предложит гибридную конфигурацию вычислительных лотков с блоками LPU, что позволит NVIDIA извлечь выгоду из дезагрегированного инференса.

-2

Существуют различные предположения о том, как LPU будут интегрированы в системы Rubin, но мы уже обсуждали возможность того, что блоки LPU будут доступны в конфигурациях на 64, 128 и 256 единиц в отдельном вычислительном лотке, соединенном с ГП Rubin через NVLink Fusion. Дженсен уже заявлял, что соглашение с Groq сыграет роль, аналогичную Mellanox, что указывает на то, что LPU помогут NVIDIA дополнить этапы рабочих нагрузок, такие как декодирование. Rubin CPX уже позволила NVIDIA охватить рабочие нагрузки предварительного заполнения (prefill), что означает, что компания охватила два основных этапа традиционного запроса на инференс.

Есть много деталей, которые стоит обсудить о роли LPU в архитектуре Rubin, но, по сути, мы говорим о сдвиге «платформы» с грядущей архитектурой, где NVIDIA предлагает различные конфигурации, нацеленные на конкретные рабочие нагрузки. Именно поэтому мы считаем, что подход компании, основанный исключительно на ГП, стал несколько устаревшим, особенно учитывая, как развиваются рабочие нагрузки ИИ.

ИИ-чипы NVIDIA следующего поколения Feynman: погружение в 3D-стекирование, 1,6-нм технологии и огромная мощность

Поскольку мы уже видели Vera Rubin в полном объеме производства, ожидается, что NVIDIA представит подробный обзор Feynman, следующего поколения архитектуры ИИ. О Feynman уже немного говорилось на GTC 2025, но, исходя из того, что нам известно о линейке, одним из наиболее значимых аспектов является то, что на этот раз NVIDIA действительно будет полагаться на закон Мура для масштабирования вычислительных возможностей. Утверждается, что Feynman будет использовать техпроцесс A16 от TSMC, и ожидается, что NVIDIA станет эксклюзивным клиентом для этого узла, учитывая, насколько ограниченным будет его вариант использования для других сегментов клиентов.

-3

Дженсен уже говорил о демонстрации на GTC 2026 чипов, «которые никогда раньше не видели», и Feynman, как ожидается, станет серьезной переработкой в плане архитектурного дизайна. Сообщается, что линейка чипов будет использовать технологию гибридного соединения TSMC, вероятно, SoIC или EMIB, а один из отчетов также предполагал, что Feynman в своей истинной форме будет использовать LPU от Groq. Мы можем увидеть обсуждения о стекировании LPU на вычислительный кристалл Feynman, поскольку это имеет смысл, учитывая, что A16 предоставляет место для фронтальных соединений LPU.

Были слухи, что NVIDIA также рассматривает техпроцесс 14A от Intel для своих чипов Feynman, но это пока не подтверждено. Приведенная выше информация проясняет одно: Feynman также ознаменует крупный сдвиг в подходе NVIDIA к микроархитектуре, поэтому масштабирование решений на уровне стоек между поколениями будет развиваться с одинаковой скоростью. Это подтверждает наш тезис о том, что GTC 2026 знаменует собой «крупный» сдвиг в том, как выполняются вычисления.

Линейка ИИ-решений NVIDIA Vera Rubin: DGX NVL8, NVL72, Rubin CPX и мега-архитектуры на уровне стоек NVL576

NVIDIA еще не закончила с Vera Rubin, так как есть много тем для обсуждения. На CES 2026 «Зеленая команда» продемонстрировала стойку NVL72 с конфигурацией из 72 чипов, но важно отметить, что на данный момент это базовое предложение. NVIDIA также планирует масштабироваться до NVL144 и NVL576, но, по слухам, мы можем не увидеть первого варианта, учитывая требования к вычислительным мощностям, которые NVIDIA видит у своих клиентов. Мы также видели, как NVIDIA представила Rubin CPX, стойку, ориентированную на контекст, для предварительного заполнения, но о внедрении у клиентов пока мало что известно.

Среди всего прочего, информация о NVL576 будет одной из самых интересных для наблюдения, поскольку NVIDIA перейдет к новому поколению «Kyber». NVIDIA перейдет к вертикальному стекированию вычислительных лотков, похожих на книги, называемых вертикальными лезвиями (vertical blades) с Kyber, а также к модели подачи питания от объекта инфраструктуры к стойке на 800 В постоянного тока. Основываясь на том, что NVIDIA сообщала нам ранее, NVL576 будет частью графических процессоров Rubin Ultra, где мы увидим капитальный ремонт конфигураций чиплетов, что можно увидеть в нашем предыдущем обзоре здесь.

-4

NVL576 также открывает новое направление во взглядах на интерконнекты, поэтому мы можем увидеть отказ от меди. С коммутаторами CPO (Co-Packaged Optics) от NVIDIA идея состоит в том, чтобы преодолеть тепловые ограничения конфигурации с 576 ГП, используя медь. В то же время ожидаются огромные улучшения пропускной способности, емкости коммутации и задержки по мере перехода на CPO. Мы подробно обсудим этот подход, как только NVIDIA предоставит больше деталей на GTC, но пока ожидайте, что компания предложит миру мега-стоечное решение на основе оптики.

Я не удивлюсь, если на GTC 2026 будет продемонстрирован NVL1,152, но нам придется подождать и посмотреть, как будут развиваться стойки. Рубин и Рубин Ультра привлекут много внимания до появления Feynman, поэтому Дженсен будет много о них говорить. Мы также ожидаем крупных анонсов, ориентированных на ЦП, включая сотрудничество с Intel.

GTC 2026 от NVIDIA начнется 16 марта, а ключевое выступление Дженсена начнется в 11:00 по тихоокеанскому времени. Как всегда, мы первыми расскажем о том, что будет представлено на мероприятии, так что обязательно следите за сайтом.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Muhammad Zuhair

Оригинал статьи