743 подписчика

NVIDIA заходит на территорию Intel и AMD — и это плохая новость для них

27 мая27 мая

370

6 мин

Иногда технологические новости выглядят как шум. Очередной чип, очередные “революционные” цифры, привычный набор партнёров — OpenAI, Anthropic, Oracle Cloud Infrastructure — всё это мы уже видели десятки раз. Но в истории с Vera есть странное ощущение. Не вау-эффект. Скорее — сдвиг. Как будто кусок инфраструктуры, который долго оставался в тени, вдруг стал центром внимания. И да, момент, когда Ian Buck лично развозит первые системы по офисам — это красиво. Почти театрально. Но за этим жестом прячется куда более прагматичная вещь: NVIDIA начинает продавать не ускорение, а контроль. Если убрать весь маркетинг про “agentic AI”, картина выглядит довольно прозаично. Есть GPU — они считают.

Есть CPU — они управляют этим хаосом. Долгое время CPU в AI-системах был чем-то вроде координатора. Важный, но вторичный. Не тот, за кого дерутся бюджеты. Теперь — нет. В NVIDIA это сформулировали аккуратно: «Каждый вызов инструмента, каждый слой оркестрации, каждое извлечение длинного контекста — это ра

Оглавление

CPU, который никто не ждал (но все почему-то сразу взяли)
Vera — это не CPU. Это попытка переписать роль CPU
“Agentic AI” — термин, который звучит как маркетинг (и им и является)

Но в истории с Vera есть странное ощущение. Не вау-эффект. Скорее — сдвиг. Как будто кусок инфраструктуры, который долго оставался в тени, вдруг стал центром внимания.

И да, момент, когда Ian Buck лично развозит первые системы по офисам — это красиво. Почти театрально. Но за этим жестом прячется куда более прагматичная вещь: NVIDIA начинает продавать не ускорение, а контроль.

CPU, который никто не ждал (но все почему-то сразу взяли)

Если убрать весь маркетинг про “agentic AI”, картина выглядит довольно прозаично.

Есть GPU — они считают.

Есть CPU — они управляют этим хаосом.

Долгое время CPU в AI-системах был чем-то вроде координатора. Важный, но вторичный. Не тот, за кого дерутся бюджеты.

Теперь — нет.

В NVIDIA это сформулировали аккуратно:

«Каждый вызов инструмента, каждый слой оркестрации, каждое извлечение длинного контекста — это работа CPU».

Фраза звучит как оправдание. И в каком-то смысле так и есть. GPU достигли потолка полезности без соответствующего “контроллера”. И этот контроллер внезапно стал узким местом.

Не потому что он слабый.

Потому что его никогда не проектировали под такие задачи.

Vera — это не CPU. Это попытка переписать роль CPU

Формально:

88 кастомных ARM-ядер (Olympus)
до 1.5 ТБ LPDDR5X
1.2 ТБ/с пропускной способности памяти
NVLink-C2C с 1.8 ТБ/с

Цифры внушительные. Но не они здесь главное.

Меня больше цепляет другое: что именно NVIDIA решила оптимизировать.

Не базы данных.

Не веб-сервисы.

Не классический HPC.

А вот это:

orchestration — оркестрация (координация и управление процессами и задачами в системе)
tool-calling — вызов инструментов (обращение модели к внешним сервисам, API или функциям)
agent sandbox — песочница агентов (изолированная среда для запуска и тестирования ИИ-агентов)
RL-окружения — среды обучения с подкреплением (Reinforcement Learning environments)
длинные цепочки вызовов — последовательности взаимосвязанных вызовов (многошаговые процессы, где один вызов ведёт к следующему)

То есть — всё то, что раньше считалось “обвязкой” вокруг модели.

Теперь это ядро нагрузки.

И здесь начинается самое интересное.

“Agentic AI” — термин, который звучит как маркетинг (и им и является)

Слово удобное. Почти идеальное. Объясняет всё и ничего одновременно.

Но если перевести на нормальный язык:

agentic AI = системы, где модель не просто отвечает, а действует

вызывает инструменты
пишет код
запускает процессы
управляет состоянием

И внезапно оказывается, что GPU в этой схеме — не главный.

Он — ускоритель.

А система живёт вокруг CPU.

Почему NVIDIA вообще полезла в CPU (и почему это выглядит агрессивно)

На первый взгляд — странный шаг.

CPU-рынок уже занят:

x86: Intel, AMD
ARM: Apple, AWS, Ampere

И тут приходит NVIDIA.

Но если смотреть не на рынок CPU, а на рынок AI-инфраструктуры, всё становится логичным.

NVIDIA давно продаёт не чипы. Она продаёт стек:

GPU
interconnect
сетевые решения
software (CUDA, NCCL и прочее)

CPU был последним чужим элементом.

А чужие элементы — это всегда риск.

«Контролируешь поток данных — контролируешь систему».

Никто это не произносит вслух, но логика прозрачная.

Самый недооценённый момент: память

LPDDR5X в сервере — звучит почти неправильно.

Это память из мобильного мира. Не из датацентров.

И всё же NVIDIA делает на неё ставку.

Почему?

Потому что задача изменилась.

Не нужно просто быстро считать.

Нужно держать тысячи параллельных состояний:

контексты агентов
промежуточные результаты
кэш запросов
sandbox-окружения

Это не столько вычисление, сколько управление состоянием.

И здесь важны:

плотность
энергопотребление
bandwidth

А не только latency и raw performance.

История с “2x быстрее” — классический пример того, как рождаются мифы

В оригинальных материалах:

+50% per-core — +50% производительности на одно ядро
2x efficiency — в 2 раза выше эффективность (в 2 раза лучше соотношение производительности к энергопотреблению)
ускорение отдельных сценариев — улучшение скорости выполнения конкретных задач или рабочих нагрузок (не всех операций в целом)

Но в пересказах появляется:

“в 2 раза быстрее Grace”

И вот уже формируется новая реальность.

Я не думаю, что это злой умысел. Скорее — привычка индустрии к громким формулировкам.

Но важно понимать:

Vera — не про “быстрее во всём”

Она про “лучше в конкретном типе нагрузки”

А это совсем другой разговор.

Демонстрация с “ручной доставкой” — не просто PR

На первый взгляд — чистый маркетинг.

Топ-менеджер с коробкой. Фото. Улыбки.

Но если присмотреться, это выглядит как сигнал:

системы ещё не массовые
поставки — штучные
идёт этап валидации

Это не рынок. Это закрытый клуб.

И туда уже попали:

OpenAI — OpenAI
Anthropic — Anthropic
Oracle Cloud Infrastructure — Oracle Cloud Infrastructure
xAI — xAI (компания Илона Маска)

Случайных имён здесь нет.

Vera Rubin — вот где настоящая игра

Сам по себе CPU — это только половина истории.

Настоящий продукт — это связка:

Vera CPU — процессор Vera (центральный процессор NVIDIA нового поколения для AI-нагрузок)
Rubin GPU — графический процессор Rubin (ускоритель для задач искусственного интеллекта и вычислений)
NVLink — NVLink (высокоскоростная технология соединения CPU и GPU для обмена данными)
unified memory — унифицированная память (общая память, доступная одновременно для CPU и GPU без копирования данных)

И вот здесь появляется ключевая идея NVIDIA:

«Дата-центр — это единица вычислений».

Не сервер.

Не стойка.

Весь датацентр.

Это уже не эволюция. Это попытка сменить уровень абстракции.

Немного скепсиса (куда без него)

Есть вещи, которые пока выглядят… мягко говоря, оптимистично.

Например:

“hundreds of thousands of Vera CPUs” от Oracle Cloud Infrastructure — «сотни тысяч процессоров Vera» от Oracle Cloud Infrastructure
“2x efficiency” без независимых тестов — «в 2 раза выше эффективность» без подтверждения независимыми тестами
идеальные сценарии agentic AI — идеализированные сценарии работы агентного ИИ (agentic AI), не обязательно отражающие реальные нагрузки

Это всё звучит знакомо.

Индустрия AI сейчас перегрета. И NVIDIA — главный бенефициар этого перегрева.

Поэтому часть заявлений — это не прогноз. Это ставка.

Что реально происходит (если отбросить шум)

Попробую сформулировать без красивых слов.

AI перестал быть только задачей GPU
CPU внезапно стал узким местом
NVIDIA решила это узкое место закрыть сама
И заодно — замкнуть весь стек на себе

Не больше. Но и не меньше.

Личное ощущение

Меня в этой истории не впечатляют цифры. Они, как обычно, “лучше, быстрее, эффективнее”.

Меня цепляет другое.

CPU, который десятилетиями был скучной, почти незаметной частью системы, вдруг снова становится стратегическим элементом.

И не потому что он стал мощнее.

А потому что изменился сам характер нагрузки.

Это редкий случай, когда железо догоняет не производительность, а идею.

Итог

Vera — это не прорыв в классическом смысле. Не новая архитектура, которая перевернёт индустрию за ночь.

Это аккуратный, но очень точный шаг.

NVIDIA просто закрывает дыру, которая стала слишком заметной.

И делает это в свойственном ей стиле —

не просто решая проблему, а превращая её в продукт.

А дальше всё будет зависеть от одного простого вопроса:

станет ли agentic AI реальной нагрузкой, или останется красивой концепцией

Если станет — Vera окажется в центре системы.

Если нет — это будет просто ещё один очень дорогой CPU, который никто толком не понял.

И, честно говоря, я пока не уверен, какой из этих сценариев ближе.