1013 подписчиков
⚠️ 14 часов назад на Computex 2024 AMD представила несколько интересных анонсов.
✅ Видеокарты для датацентров:
- AMD обещает выпускать новые видеокарты для датацентров каждый год.
✅ MI325X – это новая GPU с 288 ГБ памяти, заметно быстрее H200.
Одна машина с восемью такими видеокартами может запускать модели на триллион параметров
На бумаге она вещает вплоть до двух триллионов параметров (у оригинальной GPT-4 было 1.8T), но пока софт не поддерживает их имплементацию fp8.
MI325X ожидается в четвёртом квартале.
✅ MI350 – конкурент B200.
Ожидается 1.5x памяти и 1.5x производительности по сравнению с B200.
Релиз запланирован на следующий год.
✅Ultra Accelerator Link
AMD объявила участие в новом открытом стандарте нетворкинга – Ultra Accelerator Link. Этот стандарт будет аналогом NVLink и будет масштабироваться на сотни устройств. Разрабатывается консорциумом из Google, Meta, Broadcom, Microsoft, Intel, AMD, HPE и Cisco.
✅Процессоры с новым поколением NPU
AMD анонсировала процессоры для десктопов и ноутбуков с новым поколением NPU, способных обрабатывать 50 TOPS в новом формате Block FP16.
Заявляется, что у нового формата практически нет потери качества, и он заметно быстрее.
Это было продемонстрировано на SDXL, где в int8 результаты были неудовлетворительными, но у Block FP16 и обычного FP16 они были одинаковыми.
Стоит отметить, что это AMD, и софт там перманентно находится в очень плохом состоянии. Но все эти анонсы обещают интересные новшества
1 минута
3 июня 2024