🚀 Alibaba сократила использование GPU на 82% с новой системой Aegaeon
🚀 Alibaba сократила использование GPU на 82% с новой системой Aegaeon 🤯 Alibaba представила Aegaeon - революционную систему пуллинга GPU, которая делает обслуживание LLM-моделей в облаке в восемь раз эффективнее. ⚙️ Результаты впечатляют: - Минус 82% использования Nvidia GPU при работе моделей. - В 3-месячной бете на Alibaba Cloud: с 1 192 до 213 H20 GPU при поддержке десятков моделей до 72B параметров. 🔥 Как это работает: Обычно GPU простаивают, обслуживая «холодные» модели (17.7% GPU выполняли лишь 1...