Системы оптического распознавания символов.
Системы оптического распознавания символов. При со­здании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному доку­ментообороту, при необходимости отредактировать получен­ный по факсу документ используются системы оптического распознавания символов. С помощью сканера несложно получить изображение стра­ницы текста в графическом файле. Однако для получения до­кумента в формате текстового файла необходимо провести рас­познавание текста, т. е. преобразовать элементы графического изображения в последовательности текстовых символов...
06:44
1,0×
00:00/06:44
869,4 тыс смотрели · 4 года назад
1 неделю назад
Новый способ ускоренной оптимизации систем оптического распознавания текста разработали в НИТУ МИСИС
В НИТУ МИСИС разработали инновационный подход к оптимизации систем оптического распознавания текста (OCR). С помощью машинного обучения и современных генеративных моделей ИИ удалось повысить точность распознавания текста на русском языке и сократить время обучения с нескольких недель до 72 часов. В условиях, когда компании активно оцифровывают документы — от счетов до архивов, — технологии OCR особенно актуальны. Однако стандартные системы не всегда справляются с реальными сканами, содержащими печати, подписи или нестандартные шрифты...