В этой статье мы рассмотрим технологию оптического распознавания символов. Оптическое распознавание символов (англ. optical character recognition, OCR) - это процесс преобразования отсканированного текста или изображения в машинно-читаемый формат. Технология оптического распознавания символов уже давно используется для автоматизации процессов распознавания текста на документах, книгах, номерах паспортов и даже на рекламных баннерах. Как же работает оптическое распознавания символов? Для начала необходимо провести сканирование документа или изображения, чтобы получить его электронную копию, затем полученное изображение отправляется на специальное устройство, на котором установлено программное обеспечение, способное распознавать текст и символы. Процесс распознавания символов начинается с анализа отдельных пикселей изображения, в процессе которого, по шаблонам и структуре пикселей программа определяет контуры символов и их расположение на странице. Далее проводится процесс сравнения п