В этом гайде я покажу, как развернуть и запустить модель распознавания речи Qwen3‑ASR через пакет mlx-qwen3-asr на macOS с M-чипом. Решение позволяет транскрибировать аудио из видеофайлов с поддержкой русского языка и сохранять результат в разных форматах: SRT, VTT, TXT, JSON. mlx-qwen3-asr - это Python‑пакет, предоставляющий удобный интерфейс к модели Qwen3‑ASR‑1.7B от Alibaba Cloud, оптимизированной для работы на чипах Apple Silicon через фреймворк MLX. Модель поддерживает несколько языков, включая наш родной русский, и позволяет получать транскрипцию с тайм‑кодами. Создайте отдельную папку для проекта и перейдите в неё, у меня будет так: mkdir -p ~/Documents/ai/asr
cd ~/Documents/ai/asr python3.11 -m venv venv Активируйте виртуальное окружение: source venv/bin/activate Обновите менеджер пакетов и установите mlx-qwen3-asr: pip install --upgrade pip
pip install mlx-qwen3-asr Установка может занять несколько минут — загружаются зависимости и модель. Чтобы не вводить команды вручную ка