Найти тему
10,2 тыс подписчиков

🔥 Сегодня выпущены два самых больших открытых набора данных для распознавания текста за всю историю 📜 📜


Датасеты содержитат миллионы реальных документов, изображений и текстов для задач распознавания текста, анализа и разбора документов VQA.: https://huggingface.co/datasets/pixparse/idl-wds
Датасет дополнен аннотациями из проекта idl_data Бриттена и др. (https://arxiv.org/abs/2202.12985 )


🔥 Сегодня выпущены два самых больших открытых набора данных для распознавания текста за всю историю 📜  📜  Датасеты содержитат миллионы реальных документов, изображений и текстов для задач ...
Около минуты