Новые графические процессоры Nvidia Blackwell для центров обработки данных перегреваются, требуют модернизации конструкции серверных стоек и вызывают задержки поставок для клиентов, таких как Google, Meta и Microsoft, сообщает издание Tom's Hardware.
К перегреву приводит высокая потребляемая мощность, достигающая 120 кВт на стойку с 72 процессорами, что ограничивает производительность чипов и создает риск повреждения компонентов. Заказчики обеспокоены тем, что эти проблемы могут повлиять на сроки развёртывания новых процессоров в их дата-центрах.
Источник изображения: Microsoft/X
Для решения сложившейся ситуации Nvidia несколько раз пересматривала дизайн своих серверных стоек, работая в тесном сотрудничестве с поставщиками и партнёрами над инженерными изменениями, направленными на улучшение охлаждения серверов. Хотя такие корректировки являются стандартной практикой для крупных технологических релизов, они все же привели к дополнительным задержкам в поставках. Представитель Nvidia в комментарии Reuters подчеркнул совместную работу с облачными провайдерами и охарактеризовал изменения в конструкции как часть обычного процесса разработки.Напомним, ранее Nvidia уже приходилось откладывать начало массового производства Blackwell из-за производственного дефекта, связанного с дизайном процессора. В частности, Blackwell B100 и B200, использующие технологию упаковки TSMC CoWoS-L для соединения двух чиплетов и включающие в себя RDL-интерпозер с мостами локального кремниевого соединения (LSI), обеспечивающий скорость передачи данных до 10 ТБ/с, не соответствовал характеристикам теплового расширения чиплетов GPU, мостов LSI, RDL-интерпозера и подложки материнской платы. Всё это приводило к деформации и сбоям системы.Для решения этой проблемы Nvidia модифицировала верхние металлические слои кремния графического процессора и структуру выводов, чтобы повысить надежность производства. Хотя Nvidia никогда не раскрывала подробностей технологии этих изменений, компания отмечала, что для исправления использовала новые контроллеры. В результате окончательная версия графических процессоров Blackwell поступила в массовое производство только в конце октября.Как пишет Tom's Hardware, Nvidia сможет начать поставки этих процессоров не ранее конца января, что соответственно, негативно повлияет на планы клиентов Nvidia.