Системы оптического распознавания символов. При создании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов. С помощью сканера несложно получить изображение страницы текста в графическом файле. Однако для получения документа в формате текстового файла необходимо провести распознавание текста, т. е. преобразовать элементы графического изображения в последовательности текстовых символов...
Программы оптического распознавания символов (OCR) позволяют преобразовывать нередактируемые форматы документов, такие как PDF, изображения или бумажные документы, в машиночитаемые форматы с возможностью редактирования и поиска. Приложения OCR обычно используются для захвата текста из PDF-файлов и изображений и преобразования его в редактируемые форматы, такие как Word, Excel или обычный текстовый файл. OCR также используется для оцифровки файлов и документов, чтобы сделать их доступными для поиска или выполнения перевода файлов на другой язык...