Компания AMD совершила стратегический шаг, открыв исходный код библиотеки Quark - универсального инструмента для квантования нейросетей. Теперь разработчики могут сжимать модели в 4 раза без потери точности, адаптируя их под любые задачи: от серверных кластеров до персональных Ryzen AI-ПК. Для тестирования оптимизированных моделей не обязательно иметь собственные GPU - мощности AMD Instinct MI300X доступны через аренду на платформе G-PU.ru, где можно развернуть виртуальные стенды за $1.5/час. Quark 1.0: один инструмент для всего железа Библиотека объединяет три ключевые платформы AMD: Instinct MI300X (дата-центры): Поддержка FP8/INT4 для LLM (Llama 3.1, Grok-1). Скорость инференса 11 000 токенов/с для Mistral 7B (vs 5 200 в FP16). Интеграция с vLLM и SGLang для масштабирования на кластеры. Ryzen AI (ноутбуки/ПК): Квантование ONNX-моделей до INT4 для NPU XDNA. Скоростной экспорт через Microsoft OnnxRuntime-GenAI. Пример: DeepSeek V2 работает на Ryzen 9 8945HS с задержкой 50 мс. EPYC (CP
AMD Quark: открытый ключ к оптимизации ИИ-моделей для любых платформ
14 мая 202514 мая 2025
1 мин