Найти Π² Π”Π·Π΅Π½Π΅

πŸ”₯ ЗапускаСм модСль с 480 ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π°ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° домашнСм ПК

πŸ”₯ ЗапускаСм модСль с 480 ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π°ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° домашнСм ПК! ΠžΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ΡΡ, AI модСль ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Π½Π° локальном ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅. НС слишком быстро Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ - всСго 2 Ρ‚ΠΎΠΊΠ΅Π½Π° Π² сСкунду - Π·Π°Ρ‚ΠΎ 100% ΠΊΠΎΠ½Ρ„ΠΈΠ΄Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ. ΠšΡΡ‚Π°Ρ‚ΠΈ, модСль Qwen3 (модСль Ρ„Π°Π²ΠΎΡ€ΠΈΡ‚). Π₯ΠΎΡ‡Ρƒ ΠΏΠΎΠ΄Π΅Π»ΠΈΡ‚ΡŒΡΡ ΠΊΠ°ΠΉΡ„ΠΎΠΌ β€” ΠΌΠ½Π΅ ΡƒΠ΄Π°Π»ΠΎΡΡŒ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Qwen3-Coder-480B (Π΄Π°-Π΄Π°, чСтырСста Π²ΠΎΡΠ΅ΠΌΡŒΠ΄Π΅ΡΡΡ‚ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄ΠΎΠ² ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²) Π½Π° ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΉ локальной машинС Ρ‡Π΅Ρ€Π΅Π· llama.cpp. Мой "ΠΆΠ΅Π»Π΅Π·Π½Ρ‹ΠΉ" стСнд: CPU: Intel i9-13900KS RAM: 128 Π“Π‘ (DDR5 4800) GPU: RTX 4090 (24 Π“Π‘ VRAM) МодСль: Qwen3-Coder-480B-A35B-Instruct (вСрсии ΠΎΡ‚ Unsloth с ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ 4 ΠΈ 3 Π±ΠΈΡ‚Π°) πŸš€ Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ: UD-Q3_K_XL: ~2.0 Ρ‚ΠΎΠΊΠ΅Π½Π°/сСк UD-Q4_K_XL: ~1.0 Ρ‚ΠΎΠΊΠ΅Π½/сСк βš™οΈ ΠšΠΎΠΌΠ°Π½Π΄Ρ‹ для запуска (llama.cpp): Для Q3 (быстрСС): llama-server \ --threads 32 --jinja --flash-attn on \ --cache-type-k q8_0 --cache-type-v q8_0 \ --model <YOUR-MODEL-DIR>/Qwen3-Coder-480B-A35B-Instruct-UD-Q3_K_XL-00001-of-00005.gguf \ --ctx-size 131072 --n-cpu-moe 9999 --no-warmup Для Q4 (Ρ‚ΠΎΡ‡Π½Π΅Π΅, Π½ΠΎ ΠΌΠ΅Π΄Π»Π΅

πŸ”₯ ЗапускаСм модСль с 480 ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π°ΠΌΠΈ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° домашнСм ПК!

ΠžΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ΡΡ, AI модСль ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Π½Π° локальном ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π΅. НС слишком быстро Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ - всСго 2 Ρ‚ΠΎΠΊΠ΅Π½Π° Π² сСкунду - Π·Π°Ρ‚ΠΎ 100% ΠΊΠΎΠ½Ρ„ΠΈΠ΄Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ. ΠšΡΡ‚Π°Ρ‚ΠΈ, модСль Qwen3 (модСль Ρ„Π°Π²ΠΎΡ€ΠΈΡ‚).

Π₯ΠΎΡ‡Ρƒ ΠΏΠΎΠ΄Π΅Π»ΠΈΡ‚ΡŒΡΡ ΠΊΠ°ΠΉΡ„ΠΎΠΌ β€” ΠΌΠ½Π΅ ΡƒΠ΄Π°Π»ΠΎΡΡŒ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Qwen3-Coder-480B (Π΄Π°-Π΄Π°, чСтырСста Π²ΠΎΡΠ΅ΠΌΡŒΠ΄Π΅ΡΡΡ‚ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄ΠΎΠ² ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ²) Π½Π° ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΉ локальной машинС Ρ‡Π΅Ρ€Π΅Π· llama.cpp.

Мой "ΠΆΠ΅Π»Π΅Π·Π½Ρ‹ΠΉ" стСнд:

CPU: Intel i9-13900KS

RAM: 128 Π“Π‘ (DDR5 4800)

GPU: RTX 4090 (24 Π“Π‘ VRAM)

МодСль: Qwen3-Coder-480B-A35B-Instruct (вСрсии ΠΎΡ‚ Unsloth с ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ 4 ΠΈ 3 Π±ΠΈΡ‚Π°)

πŸš€ Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ:

UD-Q3_K_XL: ~2.0 Ρ‚ΠΎΠΊΠ΅Π½Π°/сСк

UD-Q4_K_XL: ~1.0 Ρ‚ΠΎΠΊΠ΅Π½/сСк

βš™οΈ ΠšΠΎΠΌΠ°Π½Π΄Ρ‹ для запуска (llama.cpp):

Для Q3 (быстрСС):

llama-server \

--threads 32 --jinja --flash-attn on \

--cache-type-k q8_0 --cache-type-v q8_0 \

--model <YOUR-MODEL-DIR>/Qwen3-Coder-480B-A35B-Instruct-UD-Q3_K_XL-00001-of-00005.gguf \

--ctx-size 131072 --n-cpu-moe 9999 --no-warmup

Для Q4 (Ρ‚ΠΎΡ‡Π½Π΅Π΅, Π½ΠΎ ΠΌΠ΅Π΄Π»Π΅Π½Π½Π΅Π΅):

llama-server \

--threads 32 --jinja --flash-attn on \

--cache-type-k q8_0 --cache-type-v q8_0 \

--model <YOUR-MODEL-DIR>/Qwen3-Coder-480B-A35B-Instruct-UD-Q4_K_XL-00001-of-00006.gguf \

--ctx-size 131072 --n-cpu-moe 9999 --no-warmup

πŸ’‘ Π’ΠΠ–ΠΠž: Π€Π»Π°Π³ --no-warmup обязатСлСн! Π‘Π΅Π· Π½Π΅Π³ΠΎ процСсс ΡƒΠΌΡ€Ρ‘Ρ‚ Π΄ΠΎ Π½Π°Ρ‡Π°Π»Π° сСссии.

Π”Π°, это Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ!

Запуск ΠΌΠΎΠ΄Π΅Π»ΠΈ с Π±Π΅Π·ΡƒΠΌΠ½Ρ‹ΠΌ количСством ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π° домашнСм ПК β€” Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ.

ΠšΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ Π΄Π΅Π»Π°Π΅Ρ‚ своё Π΄Π΅Π»ΠΎ.

ΠšΠ°ΠΉΡ„ β€” Π² дСталях.

Ампилов ΠΏΡ€ΠΎ ИВ: https://dzen.ru/id/623d938f380f3715018b6e3c