Для больших ИИ-инференс нагрузок Intel и SambaNova Systems предложили схему, где в одной стойке работают GPU, фирменные RDU и Intel Xeon 6. Идея простая: разные этапы агентных пайплайнов лучше разносить по разному железу, а не пытаться закрыть всё одним типом ускорителя. Компании называют это совместным hardware blueprint для enterprise, облаков и «суверенных» развертываний. Доступность заявили на вторую половину 2026 года. Архитектура делит типичный агентный инференс на роли. GPU берут на себя prefill: конвертируют промпт в key-value cache. SambaNova RDU работают на стадии decoding и генерируют токены с упором на высокую пропускную способность и низкую задержку. А Xeon 6 держит управление и исполняет код, который вокруг этого крутится. ❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО Родриго Лян (Rodrigo Liang), CEO и сооснователь SambaNova, формулирует это так: «GPUs to start the job, Intel Xeon 6 to run it, and SambaNova RDUs to finish it fast». По сути, компании
Intel и SambaNova соберут ИИ-инференс из GPU, RDU и Xeon 6
3 дня назад3 дня назад
2 мин