6519 подписчиков
Apple представила 8 больших языковых моделей (LLM) с открытым исходным кодом
Все восемь объединили под названием OpenELM. Особенность этих моделей заключается в том, что они могут работать непосредственно на устройстве без необходимости подключения к интернету.
Это позволяет использовать их в ситуациях, когда доступ к облачным сервисам ограничен или невозможен.
Четыре из представленных LLM были предварительно обучены с использованием библиотеки CoreNet.
Apple применяет многоуровневую стратегию масштабирования, которая помогает улучшить точность и эффективность работы моделей.
Компания также предоставила код, журналы обучения и различные версии моделей для общего доступа – они доступны на платформе Hugging Face Hub.
Около минуты
28 апреля 2024