Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Intel и SambaNova объединяют усилия для создания гетерогенной платформы AI-инференса

Intel и SambaNova анонсируют гетерогенную платформу инференса, использующую ЦП Intel Xeon 6, RDU SambaNova SN50 и графические процессоры Nvidia. — tomshardware.com В среду компании Intel и SambaNova объявили о создании готовой к производству гетерогенной архитектуры инференса, которая задействует ускорители ИИ или графические процессоры (GPU) для предварительного заполнения (prefill), реконфигурируемые блоки потоков данных (RDU) SambaNova SN50 для декодирования и процессоры Xeon 6 для агентных инструментов. Платформа призвана охватить максимально широкий спектр рабочих нагрузок, чтобы отвоевать долю рынка у Nvidia и других новых игроков.
Гетерогенная платформа инференса от Intel и SambaNova разделяет процесс инференса на отдельные этапы, обрабатываемые различным кремнием: она использует GPU или ускорители ИИ для обработки длинных промптов и построения кэшей “ключ-значение”; RDU SN50 от SambaNova — для декодирования и генерации токенов; а процессоры Xeon 6 — для выполнения операций, св

Intel и SambaNova анонсируют гетерогенную платформу инференса, использующую ЦП Intel Xeon 6, RDU SambaNova SN50 и графические процессоры Nvidia. — tomshardware.com

В среду компании Intel и SambaNova объявили о создании готовой к производству гетерогенной архитектуры инференса, которая задействует ускорители ИИ или графические процессоры (GPU) для предварительного заполнения (prefill), реконфигурируемые блоки потоков данных (RDU) SambaNova SN50 для декодирования и процессоры Xeon 6 для агентных инструментов. Платформа призвана охватить максимально широкий спектр рабочих нагрузок, чтобы отвоевать долю рынка у Nvidia и других новых игроков.
Гетерогенная платформа инференса от Intel и SambaNova разделяет процесс инференса на отдельные этапы, обрабатываемые различным кремнием: она использует GPU или ускорители ИИ для обработки длинных промптов и построения кэшей “ключ-значение”; RDU SN50 от SambaNova — для декодирования и генерации токенов; а процессоры Xeon 6 — для выполнения операций, связанных с агентами (например, компиляция и выполнение кода, проверка результатов), а также для координации и распределения рабочих нагрузок по аппаратному обеспечению.
Разделение этапов предварительного заполнения, декодирования и генерации токенов схоже с подходом Nvidia к платформе Rubin, основанной на
Rubin CPX и мощном GPU Rubin с памятью HBM4 — с очевидным отличием в том, что Rubin CPX не выйдет на рынок. Но, что более важно для Intel, новая платформа будет опираться на ее процессоры Xeon 6, а не на конкурирующие решения.
Решение должно стать доступным во второй половине 2026 года для предприятий, облачных операторов и программ суверенного ИИ, ищущих масштабируемые платформы инференса в целом, и особенно для кодирующих агентов и других агентных рабочих нагрузок, полностью собственными силами.
По внутренним данным SambaNova, Xeon 6 обеспечивает более чем на 50% более быструю компиляцию LLVM по сравнению с серверными процессорами на базе Arm и демонстрирует до 70% более высокую производительность в рабочих нагрузках векторных баз данных по сравнению с конкурирующими x86-процессорами — а именно,
AMD EPYC. По заявлению двух компаний, эти достижения призваны сократить сквозные циклы разработки для кодирующих агентов и аналогичных приложений.
Пожалуй, самое большое преимущество совместной готовой к производству гетерогенной архитектуры инференса заключается в том, что серверы на базе SambaNova SN50 и Xeon обратно совместимы с дата-центрами, способными выдерживать нагрузку 30 кВт, — а это подавляющее большинство
корпоративных дата-центров.
«Экосистема программного обеспечения для дата-центров построена на x86 и работает на Xeon — это зрелая, проверенная основа, на которую полагаются разработчики, предприятия и облачные провайдеры в больших масштабах», — заявил Кеворк Кечикян, исполнительный вице-президент и генеральный менеджер Группы центров обработки данных (DCG) корпорации Intel. «Рабочие нагрузки будущего потребуют гетерогенного сочетания вычислений, и это сотрудничество с SambaNova обеспечивает экономически эффективную, высокопроизводительную архитектуру инференса, разработанную для удовлетворения потребностей клиентов в масштабе — на базе Xeon 6».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Anton Shilov

Оригинал статьи

Intel
100,4 тыс интересуются