Optical character recognition (оптическое распознавание символов)- это извлечение данных из отсканированных файлов и их преобразование в машинно-кодированный текст. Распознавание текста - это область исследований в области искусственного интеллекта, распознавания образов и машинного зрения. Источники данных могут варьироваться от отсканированных документов и фотографий отчета до текста субтитров, наложенного на изображение и файлов PDF...
В этой статье мы рассмотрим технологию оптического распознавания символов. Оптическое распознавание символов (англ. optical character recognition, OCR) - это процесс преобразования отсканированного текста или изображения в машинно-читаемый формат. Технология оптического распознавания символов уже давно используется для автоматизации процессов распознавания текста на документах, книгах, номерах паспортов и даже на рекламных баннерах. Как же работает оптическое распознавания символов? Для начала...