1 подписчик

📝 Axiom-AI/Quasar-1-0.8B — reasoning-модель на 0,8B параметров, нацелена на цепочки рассуждений без облака

9 июня9 июн

1 мин

Что, если для сложных логических рассуждений не нужны десятки миллиардов параметров? Axiom-AI/Quasar-1-0.8B — ультракомпактная модель на базе Qwen3.5-0.8B, дообученная под chain-of-thought (цепочку мыслей: модель выводит рассуждение перед ответом). У модели ~0,8B параметров, и в FP16 она оценивается примерно в ~500 МБ памяти — это ощутимо легче, чем у лидеров ниши вроде Qwen3.5-9B (там параметров в разы больше). Нативное контекстное окно — 262K токенов, а при дополнительных оптимизациях заявлено расширение примерно до 1,01M. По заявленной цели — математика и наука: совместимость с бенчмарками GSM8K и GPQA, то есть задачами с многошаговым решением, а не “быстрыми фактами”. Отдельный интерес — связь с экспериментами серии Quasar и механизмом Token Temperature (модуляция внимания по “горячим” и “холодным” токенам), но конкретная степень переноса деталей в эту HF-версию не раскрыта. Запуск зависит от вашего рантайма, но веса доступны на Hugging Face: берите https://huggingface.co/Axiom-

У модели ~0,8B параметров, и в FP16 она оценивается примерно в ~500 МБ памяти — это ощутимо легче, чем у лидеров ниши вроде Qwen3.5-9B (там параметров в разы больше). Нативное контекстное окно — 262K токенов, а при дополнительных оптимизациях заявлено расширение примерно до 1,01M.

По заявленной цели — математика и наука: совместимость с бенчмарками GSM8K и GPQA, то есть задачами с многошаговым решением, а не “быстрыми фактами”. Отдельный интерес — связь с экспериментами серии Quasar и механизмом Token Temperature (модуляция внимания по “горячим” и “холодным” токенам), но конкретная степень переноса деталей в эту HF-версию не раскрыта.

Запуск зависит от вашего рантайма, но веса доступны на Hugging Face: берите https://huggingface.co/Axiom-AI/Quasar-1-0.8B и поднимайте через стандартный transformers/llama.cpp-пайплайн с квантованием под вашу VRAM. Лицензия Apache-2.0 — можно использовать и в обучении, и в коммерческих продуктах.

Если вы подбираете локальный reasoning-ассистент для документов или математики, реализация выглядит смело: цифры по бенчмаркам в описании не даны, но формат “0,8B + 262K контекст” прямо рассчитан на эксперименты на обычном железе.

#model #Quasar-1 #Qwen3.5 #reasoning #CoT #LoRA #GPQA #GSM8K

🔗 Axiom-AI/Quasar-1-0.8B