27 подписчиков

Ollama, LM Studio или Jan AI — что поставить, чтобы гонять нейросети у себя на компе

17 мая17 мая

4 мин

Полгода назад я написал гайд по LM Studio — и в комментариях сразу прилетело: «А чем Ollama хуже?», «Попробуй Jan AI!», «Зачем LM Studio, если есть терминал?». Окей. Поставил все три, погонял неделю на одном и том же железе. Рассказываю, что выяснил.

Ну смотрите. LLM (Large Language Model — большая языковая модель, это та штука, на которой работают ChatGPT, Claude и прочие) можно запускать не

Оглавление

Зачем тащить модель к себе на комп
Три программы, один ноутбук
Сравнение в лоб

Зачем тащить модель к себе на комп

Ну смотрите. LLM (Large Language Model — большая языковая модель, это та штука, на которой работают ChatGPT, Claude и прочие) можно запускать не только через сайт или API. Можно скачать модель к себе на компьютер и общаться с ней без интернета, без подписки, без VPN.

Зачем это нужно:

Приватность — ваши запросы никуда не уходят, всё крутится локально
Бесплатно — никаких $20/мес и лимитов на сообщения
Работает без интернета — в самолёте, на даче, в бункере
Без VPN — актуально для тех, у кого ChatGPT и Claude заблокированы

Есть нюанс: локальные модели слабее облачных. Llama 3.1 8B не заменит Claude Opus 4.6. Но для черновиков, суммаризации, кода и бытовых вопросов — более чем хватает.

Три программы, один ноутбук

Тестировал на MacBook Pro M2 с 16 ГБ оперативки. Для Windows-пользователей уточню отличия отдельно. Модель для теста — одна и та же: Llama 3.1 8B в квантизации Q4KM (квантизация — это сжатие модели, чтобы она влезла в память и работала быстрее; Q4 означает, что веса округлены до 4 бит вместо 16, качество падает чуть-чуть, скорость растёт сильно).

Ollama — терминальная утилита. Ставишь, пишешь ollama run llama3.1 — и через минуту общаешься с моделью прямо в консоли. Установка заняла 2 минуты. Интерфейса нет вообще — только командная строка. Зато Ollama идеально подключается к другим приложениям: VS Code, Open WebUI, любой скрипт на Python.

LM Studio — полноценное десктопное приложение с графическим интерфейсом. Скачал, открыл, нашёл модель во встроенном каталоге, нажал «Download», потом «Chat». Установка — 5 минут. Красивый чат, настройка параметров ползунками, встроенный сервер с OpenAI-совместимым API (то есть можно подставить его вместо ChatGPT в любое приложение, которое работает через API).

Jan AI — тоже десктопное приложение, но с упором на простоту. Выглядит как мессенджер. Скачал, выбрал модель из списка, пишешь. Установка — 4 минуты. Не буду врать, первый раз я просто закрыл вкладку с их сайтом — думал, очередной клон. А потом вернулся и удивился. Реально приятная штука.

Сравнение в лоб

OllamaLM StudioJan AI ИнтерфейсТерминалGUI + чатGUI + чат Установка2 мин5 мин4 мин МоделиLlama, Mistral, DeepSeek R1, Qwen 2.5, Gemma — 100+То же + удобный поиск по HuggingFaceМеньше выбор, ~50 моделей из коробки Мин. RAM8 ГБ (для 7B моделей)8 ГБ8 ГБ Рек. VRAM/RAM16 ГБ16 ГБ16 ГБ API-серверЕсть (свой формат + OpenAI)Есть (OpenAI-совместимый)Есть (OpenAI-совместимый) РасширенияЧерез сторонние UIВстроенныеПлагины ПлатформыMac, Linux, WindowsMac, Linux, WindowsMac, Linux, Windows Где каждая из них бесит

Ollama. Нет интерфейса. Совсем. Для новичка это стена — нужно открывать терминал, вводить команды, разбираться с флагами. Ещё бесит: чтобы поменять параметры генерации (температуру, контекст), нужно создавать Modelfile. Это отдельный текстовый файл с настройками. Не сложно, но и не «кликнул ползунок». Я минут двадцать провозился с первым Modelfile, пока понял синтаксис — а всего-то хотел температуру поменять.

LM Studio. На Windows с NVIDIA всё летает. А вот на Mac M1/M2 с 8 ГБ RAM — модели больше 7B параметров либо не грузятся, либо генерят по слову в секунду. И ещё: интерфейс иногда подвисает при загрузке больших моделей. Полминуты сидишь и гадаешь — зависло или качается. Раздражает.

Jan AI. Каталог моделей беднее. DeepSeek R1 я нашёл, а вот специфичные квантизации с HuggingFace так просто не подтянешь — нужно руками скачивать GGUF-файл (это формат сжатых моделей для локального запуска) и импортировать. Плюс пару раз приложение крашнулось при переключении между моделями. Неприятно.

И что в итоге ставить

Новичок на Mac с 16 ГБ RAM → LM Studio. Поставил, ткнул мышкой, общаешься. Никаких команд.

Разработчик или линуксоид → Ollama. Два слова в терминале — и модель работает. Подключается к чему угодно через API. Плюс потребляет меньше ресурсов, потому что нет графической обёртки.

Windows, 16 ГБ RAM, хочется «как ChatGPT, но бесплатно» → Jan AI. Самый простой интерфейс, похож на мессенджер. Для базовых задач — идеально. Если упрётесь в ограничения — перейдёте на LM Studio, он мощнее.

8 ГБ RAM, любая система → Ollama + модель Qwen 2.5 3B или Llama 3.2 3B. Маленькие модели, минимум потребления. GUI-приложения на слабом железе только тормозят.

Если коротко — я в итоге использую связку: Ollama как движок + Open WebUI как интерфейс в браузере. Но это уже для тех, кто не боится потратить лишние 15 минут на настройку.

Короткий вердикт

Все три — бесплатные, все три работают. Разница — в обёртке. Ollama — голый движок для тех, кому нравится терминал. LM Studio — самый функциональный GUI. Jan AI — самый простой вход, но с ограничениями.

Стоп, а что если не угадаете с выбором? Да ничего страшного. Ни одна из программ не сломает вам компьютер — пробуйте и выбирайте ту, которая легла в руку.

📱 Больше промтов, экспериментов и смешных фейлов нейросетей —

в моём Телеграме: @skazhi_ai