Найти в Дзене

Модель LLM от Apple с открытым исходным кодом изо всех сил пытается соответствовать производительности Phi-3 от Microsoft


🔸 Microsoft анонсировала семейство языковых моделей Phi-3 в апреле этого года.
🔸 Модели Phi-3 превосходят модели других размеров по ключевым показателям.
🔸 Самая маленькая модель, Phi-3-mini, в два раза превосходит модели своего размера.
🔸 Apple выпустила новую языковую модель с открытым исходным кодом DCLM-7B.
🔸 DCLM-7B обучена на основе базового набора данных DCLM и данных StarCoder и ProofPile2.
🔸 Apple опубликовала результаты оценки DCLM-7B и сравнения с другими моделями аналогичного размера.
🔸 Phi-3 от Microsoft превосходит DCLM-7B от Apple во всех трех категориях, включая MMLU.
🔸 Apple не упомянула конкретную модель Phi-3, использованную для сравнения.
🔸 Гонка за разработкой высокопроизводительных небольших языковых моделей ускоряется.
🔸 DCLM-7B от Apple демонстрирует потенциал целенаправленного сбора данных для улучшения моделей.
Модель LLM от Apple с открытым исходным кодом изо всех сил пытается соответствовать производительности Phi-3 от Microsoft  🔸 Microsoft анонсировала семейство языковых моделей Phi-3 в апреле этого...
Около минуты