Microsoft представила новую малую языковую модель Mu Microsoft только что анонсировала свою новейшую компактную языковую модель Mu 🛸Ключевые особенности Mu Размер и производительность: - Всего 330 миллионов параметров (в 10 раз меньше Phi-3.5-mini) - Скорость генерации более 100 токенов в секунду - Архитектура энкодер-декодер для максимальной эффективности Оптимизация для NPU: - Полностью работает на Neural Processing Unit (NPU) - На 47% быстрее генерация первого токена - В 4,7 раза выше скорость декодирования по сравнению с моделями decoder-only ⚙️ Технические инновации Продвинутые техники: - Dual LayerNorm — нормализация до и после каждого слоя - Rotary Positional Embeddings (RoPE) — улучшенное понимание контекста - Grouped-Query Attention (GQA) — сниженное потребление памяти Квантизация и оптимизация: - Post-Training Quantization до 8-16 бит - Совместная работа с AMD, Intel и Qualcomm - Более 200 токенов/сек на Surface Laptop 7 🔬 Практическое применение Агент в Windows Se