В этой статье мы рассмотрим технологию оптического распознавания символов. Оптическое распознавание символов (англ. optical character recognition, OCR) - это процесс преобразования отсканированного текста или изображения в машинно-читаемый формат. Технология оптического распознавания символов уже давно используется для автоматизации процессов распознавания текста на документах, книгах, номерах паспортов и даже на рекламных баннерах. Как же работает оптическое распознавания символов? Для начала...
Оптическое распознавание символов – особая технология, позволяющая трансформировать отсканированные файлы, PDF-документы и изображения в текстовые форматы с возможностью поиска и редактирования. Кроме того, в понятия “оптическое распознавание символов” сейчас вкладываются исследования в области Artificial intelligence, компьютерного зрения и распознавания образов. Элементарный пример: партнер или клиент прислал вам бумажный документ (статья/брошюра/листовка/договор). Одной отсканированной версии вам будет недостаточно для изменения документа...