11,7 тыс подписчиков
⚡️ MobileLLM: набор SLM от Facebookresearch.
MobileLLM — семейство авторегрессионных языковых моделей на оптимизированной архитектуре трансформера для использования на устройствах с ограниченными ресурсами.
В создании MobileLLM были использованы: функция активации SwiGLU, шэринг эмбединга и grouped-query attention. Модели обучались на датасете в 1 трлн. токенов
MobileLLM-125M/350M более точны на 2,7%/4,3% по сравнению с другими моделями SoTA 125M/350M в задачах zero-shot рассуждений.
В открытый доступ опубликованы 4 модели c контекстом 2 тыс. токенов:
📌Лицензирование: CC-BY-NC-4.0 License.
#AI #ML #SLM #MobileLLM
Около минуты
31 октября 2024