377 подписчиков

Transformers в MLX

26 апреля26 апр

2 мин

В мире ИИ сейчас бушуют страсти вокруг MLX – новой платформы от Apple, обещающей невероятную скорость работы больших языковых моделей (LLM) на чипах Apple Silicon. Но как перенести существующие модели, созданные на базе популярной библиотеки Transformers, в эту новую среду? Hugging Face нашла элегантное решение, которое может значительно ускорить этот процесс. В чем суть? Команда Hugging Face разработала специальный инструмент – "Skill" и "test harness" – которые помогают разработчикам адаптировать модели Transformers для работы в MLX. Главная идея – сделать этот переход максимально простым и быстрым, чтобы новые модели появлялись в MLX практически сразу после их публикации в Transformers. Ускорение перехода: Skill автоматизирует рутинные задачи, такие как создание виртуальной среды, скачивание моделей, анализ кода Transformers и написание эквивалентного кода на MLX. Это экономит огромное количество времени и сил разработчиков. Упрощение процесса: Инструмент не пытается полностью автом

Оглавление

Как ускорить переход и почему это важно
Что это дает?
Как это работает?

Как ускорить переход и почему это важно

В мире ИИ сейчас бушуют страсти вокруг MLX – новой платформы от Apple, обещающей невероятную скорость работы больших языковых моделей (LLM) на чипах Apple Silicon. Но как перенести существующие модели, созданные на базе популярной библиотеки Transformers, в эту новую среду? Hugging Face нашла элегантное решение, которое может значительно ускорить этот процесс.

В чем суть? Команда Hugging Face разработала специальный инструмент – "Skill" и "test harness" – которые помогают разработчикам адаптировать модели Transformers для работы в MLX. Главная идея – сделать этот переход максимально простым и быстрым, чтобы новые модели появлялись в MLX практически сразу после их публикации в Transformers.

Что это дает?

Ускорение перехода: Skill автоматизирует рутинные задачи, такие как создание виртуальной среды, скачивание моделей, анализ кода Transformers и написание эквивалентного кода на MLX. Это экономит огромное количество времени и сил разработчиков.

Упрощение процесса: Инструмент не пытается полностью автоматизировать процесс перевода, а скорее выступает в роли помощника. Он выполняет большую часть работы, но требует от человека проверки и корректировки результатов. Это позволяет сохранить контроль над качеством кода.

Новый взгляд на вклад в Open Source: Hugging Face рассматривает этот подход как пример того, как можно эффективно работать над открытым исходным кодом в эпоху "умных" агентов. Skill помогает людям, а не заменяет их, позволяя сосредоточиться на ключевых задачах и творческих решениях.

Как это работает?

Допустим тебе нужно перевести архитектуру модели olmo_hybrid в MLX. Просто даешь Skill запрос: "convert the olmo_hybrid architecture to MLX". Инструмент сам создаст окружение, скачает необходимые файлы, прочитает код Transformers и напишет код на MLX. Затем он запустит серию тестов, чтобы убедиться, что все работает правильно. Если что-то пойдет не так, Skill попытается отладить код и исправить ошибки. Только после успешного прохождения всех тестов он объявит о завершении работы.

Почему это важно?

MLX открывает новые возможности для работы с LLM на устройствах Apple, делая их более доступными и производительными. Ускорение процесса переноса моделей Transformers в MLX – это ключевой шаг к реализации этого потенциала. Hugging Face демонстрирует, как можно использовать современные инструменты для оптимизации работы сообщества разработчиков и ускорения развития технологий ИИ.

Skill и test harness от Hugging Face – это отличный пример того, как можно облегчить переход к новым платформам и технологиям в сфере ИИ. Это не замена человеческому труду, а мощный инструмент, который позволяет разработчикам сосредоточиться на более сложных и творческих задачах.

А ты уже пробовал работать с MLX или планируешь это сделать? Поделись своим опытом в комментариях!

Гаджеты и электроника

5,73 млн интересуются