Добавить в корзинуПозвонить
Найти в Дзене
Иван Корнев

ICR для рукописного текста: где работает, а где нет

ICR (Intelligent Character Recognition) — это не «чтение любого почерка», а распознавание рукописных символов в полях формы. Лучше всего — когда данные вписаны в заранее понятные зоны и написаны раздельно. Чем отличается: - OCR — печатный/машинный текст. - ICR — рукописные символы в полях (ФИО по клеточкам, цифры, коды). - HTR — попытка читать связный почерк/курсив (сложнее и менее предсказуемо). ICR обычно хорошо распознаёт: - цифры: даты, суммы, ID, индекс, телефон - печатные буквы (раздельно) - поля с клеточками/рамками - короткие значения с форматом вроде AA123456 Что реально повышает точность: - ограничить поле: длина, алфавит (только цифры), маска, справочник - распознавать только нужные зоны, а не весь лист - улучшить вход: ровный скан/фото без бликов, перспективы и шума - включить проверки: дата по календарю, телефон по длине, номера по шаблону - настроить human-in-the-loop: всё ниже порога уверенности — на оператора Вывод: ICR окупается на потоке однотипных форм и «коротки

ICR для рукописного текста: где работает, а где нет

ICR (Intelligent Character Recognition) — это не «чтение любого почерка», а распознавание рукописных символов в полях формы. Лучше всего — когда данные вписаны в заранее понятные зоны и написаны раздельно.

Чем отличается:

- OCR — печатный/машинный текст.

- ICR — рукописные символы в полях (ФИО по клеточкам, цифры, коды).

- HTR — попытка читать связный почерк/курсив (сложнее и менее предсказуемо).

ICR обычно хорошо распознаёт:

- цифры: даты, суммы, ID, индекс, телефон

- печатные буквы (раздельно)

- поля с клеточками/рамками

- короткие значения с форматом вроде AA123456

Что реально повышает точность:

- ограничить поле: длина, алфавит (только цифры), маска, справочник

- распознавать только нужные зоны, а не весь лист

- улучшить вход: ровный скан/фото без бликов, перспективы и шума

- включить проверки: дата по календарю, телефон по длине, номера по шаблону

- настроить human-in-the-loop: всё ниже порога уверенности — на оператора

Вывод: ICR окупается на потоке однотипных форм и «коротких» рукописных полях. Если нужен курсив и длинные комментарии — это уже задача HTR и почти всегда требует проверки человеком.

Подробнее: https://www.ivan-kornev.ru/articles/web-services/features/icr-handwritten-text-recognition