Найти в Дзене
6519 подписчиков

Apple представила 8 больших языковых моделей (LLM) с открытым исходным кодом


Все восемь объединили под названием OpenELM. Особенность этих моделей заключается в том, что они могут работать непосредственно на устройстве без необходимости подключения к интернету.
Это позволяет использовать их в ситуациях, когда доступ к облачным сервисам ограничен или невозможен.

Четыре из представленных LLM были предварительно обучены с использованием библиотеки CoreNet.
Apple применяет многоуровневую стратегию масштабирования, которая помогает улучшить точность и эффективность работы моделей.

Компания также предоставила код, журналы обучения и различные версии моделей для общего доступа – они доступны на платформе Hugging Face Hub.
Apple представила 8 больших языковых моделей (LLM) с открытым исходным кодом  Все восемь объединили под названием OpenELM.
Около минуты