Компания Apple представила новые небольшие языковые модели под названием OpenELM. Это считается важным шагом в развитии генеративных моделей искусственного интеллекта. Это также подтверждает намерение Apple предложить функции искусственного интеллекта в устройствах в дополнение к облачным сервисам ИИ.
Пока Apple готовится объявить о функциях искусственного интеллекта, которые появятся в iPhone в июне, она стремительно продвигается вперед в этой области. В последние месяцы исследователи Apple представили различные модели искусственного интеллекта и сделали новый шаг в этом направлении.
Исследователи опубликовали свои языковые модели, которые они называют "OpenELM", на платформе Hugging Face Hub. Эти модели рассматриваются как важный шаг в использовании продуктивного искусственного интеллекта в устройствах.
Модели позволяют искусственному интеллекту работать непосредственно в устройстве.
Эти модели, получившие название "Open Source Efficient Language Models" (OpenELM), характеризуются как "высокоэффективные" при решении текстовых задач, особенно в таких областях, как написание электронных писем. Кроме того, эти модели имеют открытый исходный код и могут быть использованы любым разработчиком.
Модели OpenELM доступны в четырех различных размерах и могут быть описаны как "небольшие языковые модели". Размер этих моделей составляет 270 млн параметров, 450 млн параметров, 1,1 млрд параметров и 3 млрд параметров. Параметры указывают на то, сколько переменных модели могут изучить на основе обучающих наборов данных.
Для примера, чтобы понять, насколько мал размер модели, Microsoft на днях анонсировала свою новую модель искусственного интеллекта Phi-3 и назвала ее "нашей самой маленькой моделью искусственного интеллекта". Размер этой модели составляет всего 3,8 млрд параметров. Для сравнения, модели Apple могут иметь до 270 млн параметров. Меньшие размеры означают, что они стоят дешевле и могут быть оптимизированы для более эффективной работы на таких устройствах, как мобильные телефоны и ноутбуки.