Системы оптического распознавания символов. При создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов. С помощью сканера несложно получить изображение страницы текста в графическом файле. Однако для получения документа в формате текстового файла необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательности текстовых символов...
В этой статье мы рассмотрим технологию оптического распознавания символов. Оптическое распознавание символов (англ. optical character recognition, OCR) - это процесс преобразования отсканированного текста или изображения в машинно-читаемый формат. Технология оптического распознавания символов уже давно используется для автоматизации процессов распознавания текста на документах, книгах, номерах паспортов и даже на рекламных баннерах. Как же работает оптическое распознавания символов? Для начала...