🧠 datalab-to/lift Модель для извлечения JSON из PDF и картинок по любой заданной схеме. Фишка не в очередном OCR, а в схеме на входе: модель возвращает валидный типизированный JSON, а не свободный текст. В бенче на 11 тыс. полей она держит 90.2% по полям и заметно быстрее API-альтернатив с верификацией. 💻 microsoft/FastContext-1.0-4B-RL 4B-сабагент для кодинга, который отдельно исследует репозиторий и возвращает чистый контекст. Он делает параллельные READ/GLOB/GREP вызовы и отдаёт короткие ссылки на файлы и строки, чтобы главный агент не тратил токены на мусорный просмотр кода. В связке с Mini-SWE-Agent это режет токены основного агента до 60% и даёт до +5.5% к end-to-end решению задач. 🧠 avlp12/GLM-5.2-Alis-MLX-Dynamic-3.5bpw MLX-квант GLM-5.2 для Apple Silicon, рассчитанный на полный 1M контекста. Главный смысл здесь в том, что 1M токенов помещается в 512 GB M3 Ultra за счёт int8-кеша для MLA: на 1M контексте память под кеш падает примерно с 95 до 48 GB. Авторы прямо пишут, чт