? Hugging Face — платформа, где разработчики публикуют модели машинного обучения. Что-то вроде GitHub, только для AI. Зашёл, выбрал, скачал. Осталось разобраться какую скачать и как использовать. Ollama — программа, которая запускает языковые модели прямо на твоём компьютере. Без облака, без подписки, без отправки данных на серверы OpenAI или Anthropic. Данные не уходят никуда. GGUF — формат файла, в котором хранится модель. Придуман специально для локального запуска: компактный, быстрый. Ollama работает именно с ним. Если модель на Hugging Face лежит в safetensors или bin — Ollama её не запустит напрямую. 7B и 8B — количество параметров модели в миллиардах. Параметр — числовой вес, из которых состоит нейросеть. Больше параметров — как правило, умнее ответы, но больше требований к памяти. Llama 3 8B и Mistral 7B — типичные представители этого класса, работают на обычном ноутбуке. Q4 и Q5 — уровень квантования. Квантование сжимает модель: вместо полноточных чисел используются более