1 подписчик

🧠 datalab-to/lift

ВчераВчера

1 мин

🧠 datalab-to/lift Модель для извлечения JSON из PDF и картинок по любой заданной схеме. Фишка не в очередном OCR, а в схеме на входе: модель возвращает валидный типизированный JSON, а не свободный текст. В бенче на 11 тыс. полей она держит 90.2% по полям и заметно быстрее API-альтернатив с верификацией. 💻 microsoft/FastContext-1.0-4B-RL 4B-сабагент для кодинга, который отдельно исследует репозиторий и возвращает чистый контекст. Он делает параллельные READ/GLOB/GREP вызовы и отдаёт короткие ссылки на файлы и строки, чтобы главный агент не тратил токены на мусорный просмотр кода. В связке с Mini-SWE-Agent это режет токены основного агента до 60% и даёт до +5.5% к end-to-end решению задач. 🧠 avlp12/GLM-5.2-Alis-MLX-Dynamic-3.5bpw MLX-квант GLM-5.2 для Apple Silicon, рассчитанный на полный 1M контекста. Главный смысл здесь в том, что 1M токенов помещается в 512 GB M3 Ultra за счёт int8-кеша для MLA: на 1M контексте память под кеш падает примерно с 95 до 48 GB. Авторы прямо пишут, чт

В ответ на пост

🧠 datalab-to/lift

Модель для извлечения JSON из PDF и картинок по любой заданной схеме.

Фишка не в очередном OCR, а в схеме на входе: модель возвращает валидный типизированный JSON, а не свободный текст. В бенче на 11 тыс. полей она держит 90.2% по полям и заметно быстрее API-альтернатив с верификацией.

💻 microsoft/FastContext-1.0-4B-RL

4B-сабагент для кодинга, который отдельно исследует репозиторий и возвращает чистый контекст.

Он делает параллельные READ/GLOB/GREP вызовы и отдаёт короткие ссылки на файлы и строки, чтобы главный агент не тратил токены на мусорный просмотр кода. В связке с Mini-SWE-Agent это режет токены основного агента до 60% и даёт до +5.5% к end-to-end решению задач.

🧠 avlp12/GLM-5.2-Alis-MLX-Dynamic-3.5bpw

MLX-квант GLM-5.2 для Apple Silicon, рассчитанный на полный 1M контекста.

Главный смысл здесь в том, что 1M токенов помещается в 512 GB M3 Ultra за счёт int8-кеша для MLA: на 1M контексте память под кеш падает примерно с 95 до 48 GB. Авторы прямо пишут, что это «golden spot» — лучший баланс качества и ёмкости для такого железа.

🎁 empero-ai/Qwythos-9B-Claude-Mythos-5-1M`

GGUF-сборки 9B reasoning-модели с 1M контекстом, tool calling и MTP-веткой.

В v2 починили chat template для function calling и open-code agent loops, а также добавили MTP-variants для llama.cpp. Самая компактная Q4_K_M-версия весит около 5.6 GB, так что модель уже ложится в привычный GGUF-стек без экзотики.

🦙 empero-ai/Qwythos-9B-Claude-Mythos-5-1M

9B reasoning-модель с 1M контекстом, нативным function calling и упором на длинные задачи.

По их оценке, она даёт +34 пункта на MMLU относительно базы Qwen3.5-9B и умеет сама корректироваться через инструменты: с Python и web search авторы получили 7 из 7 правильных ответов на сложных вопросах. Это уже не просто длинный контекст, а длинный контекст с рабочим tool use.

#opensource