Машинное обучение

10,5 тыс подписчиков

📄 DeepSeek-OCR - модель для распознавания текста

20 октября20 окт

18

~1 мин

📄 DeepSeek-OCR - модель для распознавания текста 🔍

DeepSeek выпустили мощную OCR-модель, способную преобразовывать изображения документов прямо в Markdown или текст.

Что умеет:

- Распознаёт текст на изображениях и в PDF

- Работает с документами, таблицами и сложными макетами

- Поддерживает разные режимы: Tiny, Small, Base, Large

- Оптимизирована под GPU (PyTorch + CUDA 11.8)

- MIT-лицензия — можно свободно использовать и модифицировать

DeepSeek-OCR достигает высокой точности и эффективности за счёт компрессии визуальных токенов. На Omnidocbench - лучшая точность при минимуме визуальных токенов, превосходит другие OCR-модели по эффективности и скорости.

🟠HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR

🟠Github: https://github.com/deepseek-ai/DeepSeek-OCR

🟠Paper: https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

@machinelearning

#ocr #DeepSeek

Взгляните на эти темы

IT (информационные технологии)

Смартфоны

Найти тему

Камеры и фототехника

Графические планшеты

Планшеты

Фитнес-трекеры

Кибербезопасность

Технологии будущего

Технологии в финансах

Гаджеты и электроника

Умные часы

Игровые консоли

Колонки и аудиосистемы

Ноутбуки

Наушники

Электронные книги

Социальные сети и мессенджеры

Технологии в социальной сфере

20,9 тыс интересуются