Похоже, на Hugging Face появился GGUF-вариант Gemma 4 на 12B для сценариев с упором на код. Это формат, который обычно ускоряет локальный инференс и упрощает запуск в окружениях без сложной конвертации весов. В репозитории есть минимум две линии: coder-fable5-composer2.5 и более агентский вариант agentic-fable5-composer2.5. Для второго в названии фигурируют множители качества/температуры (похоже на профилирование под стиль генерации), но точные бенчмарки и метрики не указаны. Что это даёт разработчику: проще попробовать модель в прототипах, где важны предсказуемость и скорость запуска, а также удобнее подбирать набор весов под задачу (черновики кода vs более «самостоятельные» шаги). Если вы сравниваете качество: цифры пока не убеждают без собственных тестов на ваших данных, но репозиторий выглядит как практичный «строительный блок» для локальных экспериментов. #model #Gemma4 #GGUF #tool #QPS #LoRA #vLLM 🔗
🛠 GGUF-сборки Gemma 4 на 12B для кодинга: можно быстрее тестировать локально и встраивать в пайплайны
СегодняСегодня
~1 мин