Найти в Дзене
ТехноLOG

NVIDIA утраивает, а Intel удваивает производительность генеративного вывода ИИ на новом бенчмарке MLPerf

Оглавление

Область генеративного искусственного интеллекта (ИИ) достигла новых высот благодаря достижениям в области логического вывода. NVIDIA утроила свою производительность генеративного вывода искусственного интеллекта, в то время как Intel удвоила свои возможности, основываясь на последнем бенчмарке MLPerf 4.0 (своего рода отраслевой стандарт, впервые включает в себя бенчмарк для генерации изображений поколения ИИ со стабильной диффузией).

NVIDIA добилась значительных успехов в повышении производительности вывода генеративных моделей искусственного интеллекта. Результаты бенчмарка MLPerf 4.0 показывают, что компания утроила (производительность инференса для суммирования текста с помощью GPT-J LLM) свои показатели по сравнению с предыдущей итерацией. Прорыв NVIDIA объясняется сочетанием аппаратных инноваций, включая использование самых современных графических процессоров (H100 Hopper) и оптимизированных программных платформ (Nvidia TensorRT-LLM). И это своеобразный дебют H200, результаты которого на 45% быстрее, чем H100 и это до того, как новейший Blackwell будет протестирован.

Nvidia
Nvidia

Значительное увеличение производительности вывода открывает новые возможности для приложений генеративного ИИ в реальном времени, таких как синтез видео, создание контента и обработка естественного языка. Это продвижение открывает путь для более сложных возможностей, основанных на искусственном интеллекте.

Параллельно с достижениями NVIDIA Intel также добилась впечатляющих успехов в повышении производительности генеративного вывода искусственного интеллекта. Согласно бенчмарку MLPerf 4.0, Intel удвоила (если рассматривать только сценарий использования суммирования текста GPT-J LLM) свои возможности по сравнению с предыдущим бенчмарком. Это достижение объясняется тем, что Intel сосредоточилась на разработке мощных процессоров (Intel Xeon 5-го поколения показал впечатляющие результаты) и оптимизации программного стека.

Intel
Intel

Благодаря этому существенному улучшению Intel готова расширить широкий спектр приложений искусственного интеллекта, включая генерацию изображений, глубокое обучение и синтез голоса. Возможность удвоения производительности вывода позволяет разработчикам создавать модели искусственного интеллекта с большей сложностью и точностью, стимулируя инновации в различных отраслях промышленности.

Последствия для генеративного ИИ и его приложений

Повышенная производительность генеративного вывода ИИ как NVIDIA, так и Intel имеет огромное значение для будущего искусственного интеллекта. Более высокая скорость вывода позволяет разворачивать модели искусственного интеллекта в реальных сценариях, требующих низкой задержки и быстрого отклика. Это особенно ценно в таких областях, как автономное вождение, виртуальная реальность и дополненная реальность, где очень важно принимать решения в реальном времени и погружаться в них.

Кроме того, улучшенная производительность генеративного ИИ открывает двери для достижений в таких областях, как здравоохранение, научные исследования и креативные индустрии. Медицинские приложения могут извлечь выгоду из более точного синтеза медицинских изображений и открытия лекарств, в то время как научные исследователи могут использовать более быстрое моделирование сложных физических явлений. Кроме того, художники и дизайнеры могут исследовать новые рубежи творчества с помощью инструментов на базе искусственного интеллекта, которые обеспечивают более быструю и реалистичную генерацию контента.

Путь вперед для генеративного ИИ

Прогресс, достигнутый NVIDIA и Intel в области генеративного вывода искусственного интеллекта, демонстрирует огромный потенциал этой технологии. Поскольку обе компании продолжают внедрять инновации, мы можем ожидать дальнейших достижений в ближайшие годы. Существенное улучшение производительности вывода позволит моделям искусственного интеллекта быстро обрабатывать большие наборы данных и генерировать высококачественные результаты в режиме реального времени, революционизируя то, как мы взаимодействуем с искусственным интеллектом.

Однако по-прежнему остаются нерешенными такие проблемы, как рассмотрение этических соображений, обеспечение конфиденциальности данных и повышение интерпретируемости генеративных моделей искусственного интеллекта. Дальнейшее сотрудничество между промышленностью, исследователями и регулирующими органами будет иметь решающее значение для преодоления этих сложностей и реализации всего потенциала генеративного ИИ на благо общества.

Экспоненциальный прогресс в производительности генеративного вывода ИИ от NVIDIA и Intel представляет собой важные вехи в области искусственного интеллекта и если смотреть в будущее, то продолжающийся прогресс в области генеративного ИИ обещает стимулировать инновации во всех отраслях промышленности, способствуя развитию технологий, научных исследований и творческих поисков.