Nvidia объявила о впечатляющих результатах своих новых чипов Blackwell в тестах MLPerf Training v5.0. Архитектура Blackwell, разработанная для удовлетворения растущих требований к производительности современных AI-приложений, продемонстрировала наивысшую производительность во всех бенчмарках, став единственной платформой, представившей результаты по всем тестам. Это особенно впечатляет на самом сложном тесте, ориентированном на большие языковые модели (LLM) — обучении модели Llama 3.1 405B. Результаты, полученные с использованием двух суперкомпьютеров на базе Blackwell — Tyche и Nyx, а также в сотрудничестве с CoreWeave и IBM (2496 GPU Blackwell и 1248 CPU Nvidia Grace), были тщательно проверены и подтверждены ассоциацией MLCommons, объединяющей более 125 членов и партнёров. В сравнении с предыдущим поколением архитектуры, Blackwell показал прирост производительности в 2,2 раза на тесте Llama 3.1 405B. На тесте Llama 2 70B LoRA fine-tuning системы Nvidia DGX B200, оснащённые восемью GP
Nvidia Blackwell ускоряет ИИ в 2,5 раза: новый рекорд производительности в обучении гигантских языковых моделей
5 июня 20255 июн 2025
23
2 мин