Опубликованы результаты последних тестов MLPerf Inference 5.0, в которых сравнивались производительность новых ускорителей NVIDIA Blackwell B200 и AMD Instinct MI325X. Тесты наглядно продемонстрировали подавляющее преимущество решений NVIDIA — система GB200 NVL72 с 72 GPU Blackwell показала в 30 раз более высокую пропускную способность в тесте Llama 3.1 405B по сравнению с предыдущим поколением H200. Даже конфигурация из восьми B200 в системе DGX B200 демонстрирует тройное превосходство над аналогичным набором H200 в тесте Llama 2 70B. Особое внимание в тестах уделялось двум ключевым метрикам для языковых моделей — времени до первого токена (TTFT) и скорости вывода токенов (TPOT). Архитектура Blackwell в сочетании с оптимизированным программным стеком NVIDIA обеспечила в 5 раз более быстрый вывод токенов и в 4,4 раза меньшее время ожидания первого ответа по сравнению с предыдущими решениями. Это открывает новые возможности для развёртывания мощных AI-систем в промышленных масштабах. AM
Ускоритель NVIDIA Blackwell установил рекорды в тестах MLPerf, опередив AMD MI325X
3 апреля 20253 апр 2025
3
2 мин