, как большой BERT - 330 млн параметров, в наше время это ни о чем; они оптимизировали ее для процессоров Intel, AMD и Qualcomm (последнее - для своих планшетов Surface); применение у нее стандартное - QA (первая картинка), но еще и Function Calling (они это называют агент для настроек, вторая картинка); по качеству она несколько хуже Phi 3B (третья картинка), интересно еще, что они помнят про свой кодовый бенчмарк CodeXGLUE, на нем давно никто не замерялся @valuableai
Microsoft представил языковую модель Mu; это кодировщик-декодировщик (что само по себе интересно, T5 как-то утратила актуальность) размером
3 июля 20253 июл 2025
1
~1 мин