3 месяца назад
ICR для рукописного текста: где работает, а где нет
ICR (Intelligent Character Recognition) — это не «чтение любого почерка», а распознавание рукописных символов в полях формы. Лучше всего — когда данные вписаны в заранее понятные зоны и написаны раздельно. Чем отличается: - OCR — печатный/машинный текст. - ICR — рукописные символы в полях (ФИО по клеточкам, цифры, коды). - HTR — попытка читать связный почерк/курсив (сложнее и менее предсказуемо). ICR обычно хорошо распознаёт: - цифры: даты, суммы, ID, индекс, телефон - печатные буквы (раздельно) - поля с клеточками/рамками - короткие значения с форматом вроде AA123456 Что реально повышает точность:...
3 месяца назад
ICR: распознавание рукописного текста в документах
ICR (Intelligent Character Recognition) переводит рукописные поля на сканах/фото в цифровой текст. Это не «волшебный OCR», а технология, которая лучше всего работает в структурированных формах и в связке с проверками. Чем отличается от других подходов - OCR — печатный текст (быстро и стабильно на «чистых» сканах) - ICR — рукописные символы (особенно раздельные/печатные) - OMR — отметки (галочки/кружки) в строго размеченных бланках - IWR — рукописные слова/фразы в контексте (чаще сложнее и требовательнее) Что влияет на точность (и дает быстрый прирост) - Дизайн формы: просьба писать печатными,...
3 недели назад
Будущее OCR: тренды в распознавании документов и искусственном интеллекте
Каждый день компании обрабатывают сотни и тысячи документов: договоры, акты, счета, анкеты клиентов. Несмотря на стремления к цифровизации, большая часть информации всё ещё поступает в виде сканов, PDF или фотографий. Ввод этих данных вручную — процесс медленный и часто подвержен ошибкам. На помощь приходит OCR (Optical Character Recognition, оптическое распознавание символов) — технология, которая превращает изображение документа в текст. Но сегодня OCR уже вышел далеко за пределы простого «чтения букв»...