Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ Π² ΠΊΠΎΡ€Π·ΠΈΠ½ΡƒΠŸΠΎΠ·Π²ΠΎΠ½ΠΈΡ‚ΡŒ
Найти Π² Π”Π·Π΅Π½Π΅

πŸ€– Π”ΠΎΠΌΠ°ΡˆΠ½ΡΡ LLM - ΠΏΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ Π²ΠΈΠΊΠΈ Π² Proxmox-Π·Π°ΠΌΠ΅Ρ‚ΠΊΠ°Ρ…

Π’Π΅ΠΌΠ° прикладная ΠΈ тСхничСская, поэтому управлСнчСский контСкст Π² этот Ρ€Π°Π· Π·Π° скобками. ΠŸΠΎΡΡ‚ адрСсован Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΠΌ ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€Π°ΠΌ ΠΈ энтузиастам с домашними сСрвСрами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ интСрСсно ΠΏΠΎΠ΄Π½ΡΡ‚ΡŒ ΡΠΎΠ±ΡΡ‚Π²Π΅Π½Π½ΡƒΡŽ LLM Π½Π° Π·Π½Π°ΠΊΠΎΠΌΠΎΠΌ ΠΆΠ΅Π»Π΅Π·Π΅ ΠΈ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π΅ Π² Ρ€Π°Π±ΠΎΡ‚Π΅, Π° Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΎ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… сборках Π² Ρ‡ΡƒΠΆΠΈΡ… Π±Π»ΠΎΠ³Π°Ρ…. Π’ Π²ΠΈΠΊΠΈ proxmox-notes Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ Π΄Π²Π΅ Π½ΠΎΠ²Ρ‹Π΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ вмСстС ΡΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π² ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ ΠΎΡ‚ Π³ΠΎΠ»ΠΎΠ³ΠΎ сСрвСра Π΄ΠΎ Ρ€Π°Π±ΠΎΡ‡Π΅Π³ΠΎ Π²Π΅Π±-Ρ‡Π°Ρ‚Π° с модСлью Π½Π° собствСнной Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Π΅. πŸ—‚οΈ Π§Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈ Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ… - ΠΏΡ€ΠΎ PCIe passthrough: Ρ‡Ρ‚ΠΎ Π²ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒ Π² BIOS, ΠΊΠ°ΠΊ разнСсти устройства ΠΏΠΎ Π³Ρ€ΡƒΠΏΠΏΠ°ΠΌ IOMMU, ΠΊΠ°ΠΊ ΠΏΡ€ΠΈΠ²ΡΠ·Π°Ρ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Ρƒ ΠΊ vfio-pci ΠΈ Π·Π°Ρ‡Π΅ΠΌ хосту встроСнная Π³Ρ€Π°Ρ„ΠΈΠΊΠ° послС проброса дискрСтной ΠΊΠ°Ρ€Ρ‚Ρ‹. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ… - ΠΏΡ€ΠΎ саму Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½ΡƒΡŽ ΠΌΠ°ΡˆΠΈΠ½Ρƒ: ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ VM ΠΏΠΎΠ΄ passthrough (q35, Π²Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ ядра, фиксированная ΠΏΠ°ΠΌΡΡ‚ΡŒ Π±Π΅Π· Π±Π°Π»Π»ΡƒΠ½ΠΈΠ½Π³Π°), установка Ubuntu Server 26.04 с Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Π°ΠΌΠΈ NVIDIA ΠΈ CUDA, Ρ€Π°Π·Π²Π΅Ρ€Ρ‚Ρ‹Π²Π°Π½ΠΈΠ΅ Ollama ΠΈ Open WebUI Π² Docker, Caddy с автоматичСским TLS ΠΏΠ΅Ρ€Π΅Π΄ Π²Π΅Π±-интСрфСйсом. На ΠΏΡ€ΠΎΡ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ всСх шагов ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ

πŸ€– Π”ΠΎΠΌΠ°ΡˆΠ½ΡΡ LLM - ΠΏΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ Π²ΠΈΠΊΠΈ Π² Proxmox-Π·Π°ΠΌΠ΅Ρ‚ΠΊΠ°Ρ…

Π’Π΅ΠΌΠ° прикладная ΠΈ тСхничСская, поэтому управлСнчСский контСкст Π² этот Ρ€Π°Π· Π·Π° скобками. ΠŸΠΎΡΡ‚ адрСсован Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΠΌ ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€Π°ΠΌ ΠΈ энтузиастам с домашними сСрвСрами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ интСрСсно ΠΏΠΎΠ΄Π½ΡΡ‚ΡŒ ΡΠΎΠ±ΡΡ‚Π²Π΅Π½Π½ΡƒΡŽ LLM Π½Π° Π·Π½Π°ΠΊΠΎΠΌΠΎΠΌ ΠΆΠ΅Π»Π΅Π·Π΅ ΠΈ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π΅ Π² Ρ€Π°Π±ΠΎΡ‚Π΅, Π° Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΎ ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… сборках Π² Ρ‡ΡƒΠΆΠΈΡ… Π±Π»ΠΎΠ³Π°Ρ….

Π’ Π²ΠΈΠΊΠΈ proxmox-notes Π΄ΠΎΠ±Π°Π²Π»Π΅Π½Ρ‹ Π΄Π²Π΅ Π½ΠΎΠ²Ρ‹Π΅ ΡΡ‚Π°Ρ‚ΡŒΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ вмСстС ΡΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π² ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ ΠΎΡ‚ Π³ΠΎΠ»ΠΎΠ³ΠΎ сСрвСра Π΄ΠΎ Ρ€Π°Π±ΠΎΡ‡Π΅Π³ΠΎ Π²Π΅Π±-Ρ‡Π°Ρ‚Π° с модСлью Π½Π° собствСнной Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Π΅.

πŸ—‚οΈ Π§Ρ‚ΠΎ Π²Π½ΡƒΡ‚Ρ€ΠΈ

Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ… - ΠΏΡ€ΠΎ PCIe passthrough: Ρ‡Ρ‚ΠΎ Π²ΠΊΠ»ΡŽΡ‡Π°Ρ‚ΡŒ Π² BIOS, ΠΊΠ°ΠΊ разнСсти устройства ΠΏΠΎ Π³Ρ€ΡƒΠΏΠΏΠ°ΠΌ IOMMU, ΠΊΠ°ΠΊ ΠΏΡ€ΠΈΠ²ΡΠ·Π°Ρ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Ρƒ ΠΊ vfio-pci ΠΈ Π·Π°Ρ‡Π΅ΠΌ хосту встроСнная Π³Ρ€Π°Ρ„ΠΈΠΊΠ° послС проброса дискрСтной ΠΊΠ°Ρ€Ρ‚Ρ‹.

Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ… - ΠΏΡ€ΠΎ саму Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½ΡƒΡŽ ΠΌΠ°ΡˆΠΈΠ½Ρƒ: ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ VM ΠΏΠΎΠ΄ passthrough (q35, Π²Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ ядра, фиксированная ΠΏΠ°ΠΌΡΡ‚ΡŒ Π±Π΅Π· Π±Π°Π»Π»ΡƒΠ½ΠΈΠ½Π³Π°), установка Ubuntu Server 26.04 с Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Π°ΠΌΠΈ NVIDIA ΠΈ CUDA, Ρ€Π°Π·Π²Π΅Ρ€Ρ‚Ρ‹Π²Π°Π½ΠΈΠ΅ Ollama ΠΈ Open WebUI Π² Docker, Caddy с автоматичСским TLS ΠΏΠ΅Ρ€Π΅Π΄ Π²Π΅Π±-интСрфСйсом.

На ΠΏΡ€ΠΎΡ…ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ всСх шагов ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ Π½ΡƒΠΆΠ½ΠΎΠ³ΠΎ ΠΆΠ΅Π»Π΅Π·Π° ΡƒΡ…ΠΎΠ΄ΠΈΡ‚ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π²Π΅Ρ‡Π΅Ρ€. На Π²Ρ‹Ρ…ΠΎΠ΄Π΅ - Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ Π²Π΅Π±-Ρ‡Π°Ρ‚ с модСлью, доступный с любого устройства домашнСй сСти ΠΈ Π½Π΅ ΠΎΡ‚ΠΏΡ€Π°Π²Π»ΡΡŽΡ‰ΠΈΠΉ запросы Π²ΠΎ внСшниС сСрвисы.

πŸ§ͺ ВСстированиС

Для тСста я попросил qwen3 ΠΈ gemma4 Π½Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ скрипты Π·Π°ΠΌΠ΅Ρ€ΠΎΠ² - ΠΈ стал свидСтСлСм Ρ‚ΠΎΠ³ΠΎ, насколько ΠΏΠΎ-Ρ€Π°Π·Π½ΠΎΠΌΡƒ ΠΌΠΎΠ΄Π΅Π»ΠΈ подходят ΠΊ ΠΎΠ΄Π½ΠΎΠΉ ΠΈ Ρ‚ΠΎΠΉ ΠΆΠ΅ Π·Π°Π΄Π°Ρ‡Π΅.

πŸ₯‡ gemma4 пошла ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€Π½Ρ‹ΠΌ ΠΏΡƒΡ‚Π΅ΠΌ: ΠΎΠ±Ρ€Π°Ρ‰Π΅Π½ΠΈΠ΅ ΠΊ Ollama API с stream: false, Ρ€Π°Π·Π±ΠΎΡ€ ΠΏΠΎΠ»Π΅ΠΉ eval_count ΠΈ total_duration для ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎΠ³ΠΎ ΡƒΡ‡Π΅Ρ‚Π° Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ, аккуратная структура Π·Π°ΠΌΠ΅Ρ€Π° - ΠΏΡ€Π°Π²Π΄Π°, с арифмСтичСской ошибкой Π² ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Ρ„ΠΎΡ€ΠΌΡƒΠ», ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Ρ‡ΠΈΠ½ΠΈΡ‚ΡŒ Ρ€ΡƒΠΊΠ°ΠΌΠΈ.

πŸ€·β€β™‚οΈ qwen3-coder Π²Ρ‹Π±Ρ€Π°Π»Π° ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠΉ ΠΏΡƒΡ‚ΡŒ - subprocess с Π·Π°ΠΌΠ΅Ρ€ΠΎΠΌ time.time() Π²ΠΎΠΊΡ€ΡƒΠ³ внСшнСго Π²Ρ‹Π·ΠΎΠ²Π°: Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Ρ€Π°Π±ΠΎΡ‡Π΅Π΅, Π½ΠΎ систСматичСски Π·Π°Π½ΠΈΠΆΠ°ΡŽΡ‰Π΅Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π½Π° Π½Π°ΠΊΠ»Π°Π΄Π½Ρ‹Π΅ расходы запуска процСсса.

ВсС ΠΊΠ°ΠΊ Ρƒ людСй.

Набор тСстов простой: логичСская Π·Π°Π΄Π°Ρ‡Π° Π½Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ дня Π½Π΅Π΄Π΅Π»ΠΈ, арифмСтичСский расчСт, написаниС Ρ…ΠΎΠΊΠΊΡƒ ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π½Π° ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½Ρ‹Ρ… запусках. Π§Π΅Ρ€Π΅Π· Π½Π΅Π³ΠΎ ΠΏΡ€ΠΎΠ³ΠΎΠ½ΡΠ»ΠΈΡΡŒ ΡˆΠ΅ΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΡ‚ 8B Π΄ΠΎ 30B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ².

⏱️ Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ тСстов

На 16 Π“Π‘ VRAM ΠΊΠΎΠΌΡ„ΠΎΡ€Ρ‚Π½ΠΎ ΠΆΠΈΠ²ΡƒΡ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ уровня 24-30B Π² ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠΈ Q4. MoE-Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ ΠΏΠΎ скорости ΠΎΠΏΠ΅Ρ€Π΅ΠΆΠ°ΡŽΡ‚ ΠΏΠ»ΠΎΡ‚Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ сопоставимого Ρ€Π°Π·ΠΌΠ΅Ρ€Π°. МодСли с Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠΌ рассуТдСниСм Ρ€Π°ΡΡ…ΠΎΠ΄ΡƒΡŽΡ‚ Π½Π° Π½Π΅Π³ΠΎ Π·Π°ΠΌΠ΅Ρ‚Π½ΡƒΡŽ долю Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ², ΠΈ практичСская ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Ρƒ Π½ΠΈΡ… Π½ΠΈΠΆΠ΅ номинальной. По качСству: llama3.1:8b спотыкаСтся Π΄Π°ΠΆΠ΅ Π½Π° простых Π·Π°Π΄Π°Ρ‡Π°Ρ…, qwen3.5 Π½Π° Ρ…ΠΎΠΊΠΊΡƒ ΡƒΡˆΠ»Π° Π² бСсконСчный Ρ†ΠΈΠΊΠ», Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ сбалансированной оказалась gpt-oss; для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с ΠΊΠΎΠ΄ΠΎΠΌ ΡƒΠ΄ΠΎΠ±Π½Π΅Π΅ gemma4, для Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… тСкстов - mistral-small3.2. ΠŸΠΎΠ»Π½Ρ‹Π΅ Ρ†ΠΈΡ„Ρ€Ρ‹ - Π² самой Π²ΠΈΠΊΠΈ.

πŸ”— Бсылки

ΠŸΡ€ΠΎΠ±Ρ€ΠΎΡ Π²ΠΈΠ΄Π΅ΠΎΠΊΠ°Ρ€Ρ‚Ρ‹:

https://github.com/kropachev/proxmox-notes/wiki/proxmox-pcie-passthrough

Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΌΠ°ΡˆΠΈΠ½Ρ‹ ΠΏΠΎΠ΄ LLM:

https://github.com/kropachev/proxmox-notes/wiki/proxmox-creating-llm-vm

#LLM #AI #GenAI #CTO #NVIDIA #CUDA #Ollama #Homelab