Когда Apple представила чип M5, многим показалось, что обновление получилось “косметическим”. Но, судя по свежим данным из блога Apple Machine Learning Research, самое главное улучшение M5 спрятано не в маркетинговых слайдах — а в том, как этот чип работает с локальными LLM-моделями. Если коротко: новый M5 стал заметно быстрее при генерации текста и изображений прямо на устройстве, без интернета и серверов. И именно такие задачи в ближайшие годы станут главными. Несколько лет назад Apple выпустила свой фреймворк MLX. Если объяснять - это такая “операционная система для ИИ внутри Mac”.
Она позволяет: По сути, MLX сделал возможным то, о чём пару лет назад только мечтали: локальный ChatGPT-уровень прямо на ноутбуке, без облаков. И теперь Apple на практике показала, как новое поколение её чипов раскрывает потенциал этого фреймворка. Apple запустила несколько популярных моделей: Qwen 1.7B, Qwen 8B, Qwen 14B (в 4-битной версии), Qwen 30B MoE, GPT OSS 20B. И сравнила две вещи:. Скорость гене