Что, если для сложных логических рассуждений не нужны десятки миллиардов параметров? Axiom-AI/Quasar-1-0.8B — ультракомпактная модель на базе Qwen3.5-0.8B, дообученная под chain-of-thought (цепочку мыслей: модель выводит рассуждение перед ответом). У модели ~0,8B параметров, и в FP16 она оценивается примерно в ~500 МБ памяти — это ощутимо легче, чем у лидеров ниши вроде Qwen3.5-9B (там параметров в разы больше). Нативное контекстное окно — 262K токенов, а при дополнительных оптимизациях заявлено расширение примерно до 1,01M. По заявленной цели — математика и наука: совместимость с бенчмарками GSM8K и GPQA, то есть задачами с многошаговым решением, а не “быстрыми фактами”. Отдельный интерес — связь с экспериментами серии Quasar и механизмом Token Temperature (модуляция внимания по “горячим” и “холодным” токенам), но конкретная степень переноса деталей в эту HF-версию не раскрыта. Запуск зависит от вашего рантайма, но веса доступны на Hugging Face: берите https://huggingface.co/Axiom-
📝 Axiom-AI/Quasar-1-0.8B — reasoning-модель на 0,8B параметров, нацелена на цепочки рассуждений без облака
9 июня9 июн
1 мин