Недавно Apple представила новое семейство больших языковых моделей с открытым исходным кодом, известных как OpenELM (эффективные языковые модели с открытым исходным кодом). Эти модели предназначены для локальной работы на устройствах, что знаменует значительный переход от традиционной зависимости от облачных серверных вычислений. Эта разработка является частью более широкой стратегии Apple по интеграции более продвинутых возможностей искусственного интеллекта непосредственно в свои устройства, повышая как конфиденциальность, так и скорость обработки данных Обзор OpenELM В моделях OpenELM используется стратегия послойного масштабирования, которая эффективно распределяет параметры внутри каждого уровня модели transformer для повышения точности. Например, при бюджете параметров примерно в один миллиард параметров OpenELM продемонстрировал повышение точности на 2,36% по сравнению со своей предшественницей OLMo, при этом потребовалось вдвое меньше токенов предварительной подготовки. В Тако
Apple выпускает встроенную модель искусственного интеллекта
25 апреля 202425 апр 2024
1
1 мин