Найти в Дзене
Машинное обучение

📄 DeepSeek-OCR - модель для распознавания текста

📄 DeepSeek-OCR - модель для распознавания текста 🔍

DeepSeek выпустили мощную OCR-модель, способную преобразовывать изображения документов прямо в Markdown или текст.

Что умеет:

- Распознаёт текст на изображениях и в PDF

- Работает с документами, таблицами и сложными макетами

- Поддерживает разные режимы: Tiny, Small, Base, Large

- Оптимизирована под GPU (PyTorch + CUDA 11.8)

- MIT-лицензия — можно свободно использовать и модифицировать

DeepSeek-OCR достигает высокой точности и эффективности за счёт компрессии визуальных токенов. На Omnidocbench - лучшая точность при минимуме визуальных токенов, превосходит другие OCR-модели по эффективности и скорости.

🟠HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR

🟠Github: https://github.com/deepseek-ai/DeepSeek-OCR

🟠Paper: https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

@machinelearning

#ocr #DeepSeek

-2
Deep Seek
20,9 тыс интересуются