25 апреля компания Apple представила восемь языковых моделей с открытым исходным кодом — модели OpenELM (эффективные языковые модели с открытым исходным кодом). Особенность в том, что они запускаются непосредственно на устройстве, а не на облачных серверах.
Большие языковые модели уже готовы для использования разработчиками, и их можно загрузить с платформы Hugging Face (там собраны коллекции готовых современных предварительно обученных моделей).
Изображение из открытых источников Четыре модели OpenELM были предварительно обучены с использованием библиотеки CoreNet. CoreNet — это недавно выпущенная Apple библиотека для обучения глубоких нейронных сетей и OpenELM, которая считается современным семейством открытых языковых моделей. Остальные четыре языковые модели являются моделями обучения и, следовательно, могут понимать и интерпретировать вводимые данные, сформулированные в виде прямых инструкций.
Модели и полная система обучения и оценки доступны в общедоступных наборах данных. Это означает, что существуют протоколы обучения, несколько контрольных точек и предтренировочные конфигурации. Разработчики могут получить к ним доступ через Hugging Face, сообщество для обмена кодом искусственного интеллекта. Эта платформа становится все более популярной и уже насчитывает более 350 тысяч моделей, 75 тысяч наборов данных и 150 тысяч демонстрационных приложений. Все они доступны с открытым исходным кодом и предназначены для содействия сотрудничеству и прогрессу в секторе машинного обучения.
Apple полагается на стратегию многоуровневого масштабирования. Разработка повысит точность и эффективность LLM. Это также объясняет, почему Apple предоставляет код, протоколы обучения и несколько версий и не предоставляет окончательную обученную модель. Исследователи, стоящие за проектом, надеются на быстрый прогресс и «достоверные результаты» в области искусственного интеллекта естественного языка.
По заявлению Apple, новые модели OpenELM были выпущены с целью обогатить открытое исследовательское сообщество в создании крупномасштабных языковых моделей. Технология с открытым исходным кодом может минимизировать риски, искажения данных и моделей.
В феврале генеральный директор Тим Кук заявил, что функции генеративного ИИ появятся на устройствах Apple в этом году. Новые функции искусственного интеллекта пока не установлены на iPhone, Macbook и прочих устройствах. Однако сообщается, что iOS 18 включает в себя ряд новых функций искусственного интеллекта.
По словам корреспондента Bloomberg Apple Марка Гурмана, функции ИИ в iOS 18 будут в первую очередь основаны на большой языковой модели непосредственно на устройстве. Они предназначены для обеспечения лучшей защиты данных и более высокой скорости.