22:05
1,0×
00:00/22:05
370 смотрели · 2 года назад
Следом Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход
У модели 3B параметров, но активируются только 500M. При этом она показывает новые SOTA-результаты на OmniDocBench v1.5 и v1.6. Главная фишка - Reference Sliding Window Attention. Модель держит в фокусе: • исходный документ • недавний контекст • следующие слова А всё лишнее постепенно «забывает», чтобы не раздувать вычисления...