26 подписчиков

Запускаю DeepSeek R1 на Mac без облака: гайд за 8 минут

16 мая16 мая

3 мин

Модель, которая рассуждает как OpenAI o1, — бесплатно, оффлайн, прямо на ноутбуке. Без VPN, без подписок, без отправки данных на чужие серверы. Поставил её на свой MacBook за вечер и сейчас покажу, как повторить.

Окей, коротко. DeepSeek R1 — это «рассуждающая модель» (reasoning model). Она не просто выдаёт ответ, а думает пошагово: разбивает задачу на части, проверяет себя, откатывается назад,

Оглавление

Зачем тащить нейросеть к себе на ноутбук
Что нужно от вашего Mac
Установка: 3 шага, 8 минут

Зачем тащить нейросеть к себе на ноутбук

Окей, коротко. DeepSeek R1 — это «рассуждающая модель» (reasoning model). Она не просто выдаёт ответ, а думает пошагово: разбивает задачу на части, проверяет себя, откатывается назад, если зашла в тупик. Примерно как o1 от OpenAI, только открытая и бесплатная.

Но есть нюанс. Облачная версия DeepSeek работает через серверы в Китае. Данные уходят туда, задержки бывают дикие, а VPN-танцы утомляют. Локальный запуск решает всё разом: промты никуда не уходят, интернет не нужен, скорость зависит только от железа.

Не буду врать — я сначала не верил, что на ноутбуке можно гонять рассуждающую модель с нормальной скоростью. Ошибался.

Что нужно от вашего Mac

Главное условие — чип Apple Silicon (M1, M2, M3, M4). Intel-маки не подойдут. Слишком медленно.

Дальше зависит от оперативки:

8 ГБ (M1/M2 base) — потянет модель на 1.5B–7B параметров в формате Q4. Будет работать, но не летать
16 ГБ (M2/M3/M4) — комфортная зона для 7B Q4. Около 15–20 токенов в секунду (токен — это примерно 3/4 слова, то есть модель выдаёт ~12–15 слов в секунду)
32–36 ГБ (M3 Pro/Max, M4 Pro) — можно замахнуться на 14B и даже 32B версии

Ставить будем DeepSeek R1 Distill 7B Q4 — облегчённую версию. «Q4» означает квантизацию (сжатие весов модели из 16-битных чисел в 4-битные — модель занимает в 4 раза меньше памяти, а качество падает процентов на 5–10). Файл весит около 4.5 ГБ.

Установка: 3 шага, 8 минут

Я использую LM Studio — у него графический интерфейс, не надо лезть в терминал.

Шаг 1. Скачиваем LM Studio с официального сайта lmstudio.ai. Версия для Mac Silicon. Устанавливаем как обычное приложение — перетащили в Applications, запустили.

Шаг 2. В поиске LM Studio набираем deepseek-r1-distill-qwen-7b. Выбираем вариант Q4KM (оптимальный баланс размера и качества). Жмём Download. На моём интернете 4.5 ГБ качались минуты три.

Шаг 3. После загрузки выбираем модель в выпадающем списке сверху, открываем чат — и всё. Пишем промт, модель думает, отвечает.

Если предпочитаете терминал — то же самое через Ollama: brew install ollama && ollama run deepseek-r1:7b. Две команды, и готово.

Знаете что? Первый раз я просто закрыл вкладку и забил — думал, зависло. Нет, модель реально «рассуждает» перед ответом, и первые 10–15 секунд она молча думает. Это нормально. Я потом полчаса гуглил «lm studio deepseek hang» прежде чем до меня дошло.

Скорость на разных Mac

Примерные цифры для DeepSeek R1 7B Q4 (генерация, не промт-процессинг):

M1 8 ГБ — ~8–12 токенов/сек. Терпимо для коротких задач
M2 16 ГБ — ~18–22 токена/сек. Комфортно
M3 Pro 18 ГБ — ~25–30 токенов/сек. Быстрее, чем печатаешь
M4 Pro 24 ГБ — ~35+ токенов/сек. Кайф

На моём M2 Pro с 16 ГБ получилось стабильно 20 токенов в секунду. Ответ на сложный вопрос — 30–40 секунд. Вполне рабочая история.

Где она тащит, а где буксует

Проверил на трёх задачах:

Деловое письмо. Попросил написать ответ подрядчику с переносом сроков. Модель выдала три варианта тона — мягкий, нейтральный, жёсткий. Каждый с аргументацией. Обалдел, если честно.

Логическая задачка. Классика: «У фермера волк, коза и капуста». R1 расписала рассуждение на 12 шагов, проверила каждый вариант, нашла решение. Видно, как она думает — это прямо залипательно.

Проверка кода. Скормил баг в Python-скрипте на ~40 строк. Нашла ошибку, объяснила почему, предложила фикс. На уровне Claude Sonnet для такого размера задачи. Ну, почти — один раз предложила «фикс», который ломал другую функцию, но со второго промта поправилась.

Стоп, а что она не тянет?

Длинный контекст — окно 4096 токенов (примерно 3000 слов). Книгу не проанализируешь
Веб-поиск — модель оффлайн, свежих данных у неё нет
Картинки — эта версия текстовая, мультимодальности нет
Сложный код на 200+ строк — 7B-модели не хватает «мозгов», тут нужна минимум 32B или облачная версия

И зачем это всё?

Локальный DeepSeek R1 — это такой калькулятор-переросток у вас на столе. Он не заменит полноценный ChatGPT или Claude с их терабайтами знаний и доступом в интернет. Но для быстрых задач — переписать текст, разобрать логику, проверить код, набросать план — работает отлично. И главное: данные остаются на вашем ноутбуке. Никуда не утекают. Никогда.

Ладно, звучит как реклама. Но это правда бесплатно, и настраивается за 8 минут. Попробуйте — потом расскажете.

📱 Больше промтов, экспериментов и смешных фейлов нейросетей —

в моём Телеграме: @skazhi_ai