Модель, которая рассуждает как OpenAI o1, — бесплатно, оффлайн, прямо на ноутбуке. Без VPN, без подписок, без отправки данных на чужие серверы. Поставил её на свой MacBook за вечер и сейчас покажу, как повторить.
Зачем тащить нейросеть к себе на ноутбук
Окей, коротко. DeepSeek R1 — это «рассуждающая модель» (reasoning model). Она не просто выдаёт ответ, а думает пошагово: разбивает задачу на части, проверяет себя, откатывается назад, если зашла в тупик. Примерно как o1 от OpenAI, только открытая и бесплатная.
Но есть нюанс. Облачная версия DeepSeek работает через серверы в Китае. Данные уходят туда, задержки бывают дикие, а VPN-танцы утомляют. Локальный запуск решает всё разом: промты никуда не уходят, интернет не нужен, скорость зависит только от железа.
Не буду врать — я сначала не верил, что на ноутбуке можно гонять рассуждающую модель с нормальной скоростью. Ошибался.
Что нужно от вашего Mac
Главное условие — чип Apple Silicon (M1, M2, M3, M4). Intel-маки не подойдут. Слишком медленно.
Дальше зависит от оперативки:
- 8 ГБ (M1/M2 base) — потянет модель на 1.5B–7B параметров в формате Q4. Будет работать, но не летать
- 16 ГБ (M2/M3/M4) — комфортная зона для 7B Q4. Около 15–20 токенов в секунду (токен — это примерно 3/4 слова, то есть модель выдаёт ~12–15 слов в секунду)
- 32–36 ГБ (M3 Pro/Max, M4 Pro) — можно замахнуться на 14B и даже 32B версии
Ставить будем DeepSeek R1 Distill 7B Q4 — облегчённую версию. «Q4» означает квантизацию (сжатие весов модели из 16-битных чисел в 4-битные — модель занимает в 4 раза меньше памяти, а качество падает процентов на 5–10). Файл весит около 4.5 ГБ.
Установка: 3 шага, 8 минут
Я использую LM Studio — у него графический интерфейс, не надо лезть в терминал.
Шаг 1. Скачиваем LM Studio с официального сайта lmstudio.ai. Версия для Mac Silicon. Устанавливаем как обычное приложение — перетащили в Applications, запустили.
Шаг 2. В поиске LM Studio набираем deepseek-r1-distill-qwen-7b. Выбираем вариант Q4KM (оптимальный баланс размера и качества). Жмём Download. На моём интернете 4.5 ГБ качались минуты три.
Шаг 3. После загрузки выбираем модель в выпадающем списке сверху, открываем чат — и всё. Пишем промт, модель думает, отвечает.
Если предпочитаете терминал — то же самое через Ollama: brew install ollama && ollama run deepseek-r1:7b. Две команды, и готово.
Знаете что? Первый раз я просто закрыл вкладку и забил — думал, зависло. Нет, модель реально «рассуждает» перед ответом, и первые 10–15 секунд она молча думает. Это нормально. Я потом полчаса гуглил «lm studio deepseek hang» прежде чем до меня дошло.
Скорость на разных Mac
Примерные цифры для DeepSeek R1 7B Q4 (генерация, не промт-процессинг):
- M1 8 ГБ — ~8–12 токенов/сек. Терпимо для коротких задач
- M2 16 ГБ — ~18–22 токена/сек. Комфортно
- M3 Pro 18 ГБ — ~25–30 токенов/сек. Быстрее, чем печатаешь
- M4 Pro 24 ГБ — ~35+ токенов/сек. Кайф
На моём M2 Pro с 16 ГБ получилось стабильно 20 токенов в секунду. Ответ на сложный вопрос — 30–40 секунд. Вполне рабочая история.
Где она тащит, а где буксует
Проверил на трёх задачах:
Деловое письмо. Попросил написать ответ подрядчику с переносом сроков. Модель выдала три варианта тона — мягкий, нейтральный, жёсткий. Каждый с аргументацией. Обалдел, если честно.
Логическая задачка. Классика: «У фермера волк, коза и капуста». R1 расписала рассуждение на 12 шагов, проверила каждый вариант, нашла решение. Видно, как она думает — это прямо залипательно.
Проверка кода. Скормил баг в Python-скрипте на ~40 строк. Нашла ошибку, объяснила почему, предложила фикс. На уровне Claude Sonnet для такого размера задачи. Ну, почти — один раз предложила «фикс», который ломал другую функцию, но со второго промта поправилась.
Стоп, а что она не тянет?
- Длинный контекст — окно 4096 токенов (примерно 3000 слов). Книгу не проанализируешь
- Веб-поиск — модель оффлайн, свежих данных у неё нет
- Картинки — эта версия текстовая, мультимодальности нет
- Сложный код на 200+ строк — 7B-модели не хватает «мозгов», тут нужна минимум 32B или облачная версия
И зачем это всё?
Локальный DeepSeek R1 — это такой калькулятор-переросток у вас на столе. Он не заменит полноценный ChatGPT или Claude с их терабайтами знаний и доступом в интернет. Но для быстрых задач — переписать текст, разобрать логику, проверить код, набросать план — работает отлично. И главное: данные остаются на вашем ноутбуке. Никуда не утекают. Никогда.
Ладно, звучит как реклама. Но это правда бесплатно, и настраивается за 8 минут. Попробуйте — потом расскажете.
📱 Больше промтов, экспериментов и смешных фейлов нейросетей —
в моём Телеграме: @skazhi_ai