Ключевой вывод: следуя простым инструкциям, вы настроите современный мини-ИИ помощник на LLM 2.0 в Windows 11, освоив установку библиотек, загрузку и оптимизацию модели, запуск API и веб-интерфейса. Шаг 1. Установка Python и виртуального окружения pip install --upgrade \
transformers[torch] accelerate \
bitsandbytes optimum[onnxruntime-gpu] onnxruntime-gpu \
gradio fastapi uvicorn Создайте model_setup.py: from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
model_name = "llm2-base-ru"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype=torch.bfloat16,
device_map="auto",
use_cache=True
)
model.eval() Создайте quantize.py: from transformers import AutoModelForCausalLM, BitsAndBytesConfig
bnb_config = BitsAndBytesConfig(load_in_8bit=True, llm_int8_threshold=6.0)
model_8bit = AutoModelForCausalLM.from_pretrained(
"llm2-base-ru",
quantization_config=bnb_config,
to