Кастом(тюнинг) мотоцикла Тула ТМЗ-5.951 Ч.1.Черновик
🚀 LFM2.5-350M после fine-tuning делает tool calling точнее: 61% → 98% и годится для локальных агентов на CPU
Модель mosama LFM2.5-350M-Tool-Calling-Merged-v3 дообучили под вызов функций, чтобы ассистент не только писал текст, но и запускал нужные действия. Контрастный результат из тестов: shell-команды без дообучения — 61.4% корректных вызовов, после fine-tuning — 98.0%. Для сравнения, у FunctionGemma на сопоставимых задачах эквивалентность лишь 10–39%. По размеру это 350M параметров и контекст 32k; заявлено, что KV-кеш занимает на 90% меньше памяти, что делает edge-деплой реалистичным. В описании также есть прогон на AMD CPU: 239 tok/s при потреблении <1GB RAM...