Найти тему
SRS Blog

Электронный документооборот. Сканирование и оцифровка документов.

Оглавление

Электронный документооборот - это тенденция, стремительно набирающая оборот. Удобство использования, хранения, архивирования, быстрота доступа к информации, снижение расходов на бумагу, покупку/аренду и содержание оборудования для печати, курьерскую и почтовую службы - несомненные плюсы новых безбумажных технологий.

Оцифровка документов
Оцифровка документов

Катализаторы тренда: снижение удельной стоимости хранения данных, доступность интернета, распространение облачных сервисов хранения и обработки информации, широкое внедрение электронной идентификации (цифровая подпись), т.е. технологическая база с одной стороны и запросы современного общества на безопасность, скорость и удобство с другой - способствуют наращиванию темпов цифровизации.

Как и любое новое явление, оно приходит со своими плюсами и минусами. И это могут быть как совершенно невообразимые ранее удобства, уникальные сервисы и более высокая планка стандарта качества услуг, так и новые риски, заботы и опасения, которые внезапно становятся актуальными.

Итак, решение минимизировать бумажный документооборот принято, и для начала, обсудим, что делать с уже существующими печатными версиями договоров и контрактов. Каждый случай уникален: какая-то часть отправится в традиционные бумажные архивы, более актуальные документы будут оцифрованы, позволяя работать уже с их электронными копиями.

Сам процесс оцифровки не представляет какой-либо сложности, полезно лишь проговорить ключевые моменты.

Сканирование

Понимание того, как в дальнейшем будет использоваться электронная копия документа, например, для хранения на дисковых или облачных хранилищах, отправки по электронной почте или размещения на странице в интернете, для создания фотоальбома или обработки в графическом редакторе или в системах распознавания текста OCR - от этого зависит выбор настроек в процессе сканирования.

Планшетный сканер
Планшетный сканер

При сканировании для отображения на экране следует учитывать плотность пикселей устройства, на котором предполагается просмотр. Современные мониторы обладают разрешением от 96 dpi и выше. Таким образом, минимальный размер картинки 3 на 4 см. должен быть не менее 120 на 160 пикселей. На экранах высокого разрешения, например выполненных по технологии Retina (продукция Apple), более высокой четкости изображения можно достичь, увеличив разрешение в два раза, т.е. до размера 240 на 320 пикселей. К сожалению, при сохранении формата и параметров сжатия, это приведет к неизбежному увеличению размера файла в четыре раза.

Оболочки управления сканером сильно отличаются между собой, но управление разрешением сканирования является обязательным параметром. Если вы не планирует редактировать (масштабировать) картинку, установите разрешение, например 100
dpi, нажмите кнопку "Сканировать".

разрешение 100dpi
разрешение 100dpi

Для улучшения качества отображения на экранах с высоким разрешением, просто увеличьте параметр "разрешение" до 200 dpi:

Разрешение 200dpi
Разрешение 200dpi

Откройте эту страницу на экране Retina или на другом устройстве, с экраном высокого разрешения, либо воспользуйтесь функцией масштабирования вашего браузера. Сравните детализацию картинок, сканированных:

Разрешение сканирования справа в два раза выше
Разрешение сканирования справа в два раза выше

Размер файлов (сжатие без потери качества) составит 46 и 167 кбайт, соответственно. Это происходит потому, что при увеличении линейного размера в два раза, количество информации увеличивается в четыре.

Формат файла

Если глубоко не погружаться в тему, то для фотографических изображений следует использовать JPEG с умеренным сжатием, если же картинка имеет контрастное изображение (текст, линии, сплошные заливки), то следует обратить внимание на графический формат GIF (но палитра будет ограничена 256 полутонами), который по соотношению качество/размер файла имеет некоторое преимущество.

Если вы планируете редактировать отсканированное изображение, то используйте форматы без потери качества: TIFF, PNG или BMP. Причем, TIFF или PNG используют алгоритмы сжатия без потери качества. PNG имеет отличную программную совместимость. Файлы формата BMP имеют большой размера файла, его использование оправдано, если устройства, на котором будут редактировать файлы имеют ограничение в поддержке других форматов изображения. Формат TIFF, обладая преимуществами, обсуждение которых выходит за рамки статьи, имеет низкий коэффициент сжатия и хорошо сжимается zip-архиватором, например, перед отправкой по электронной почте. Подробнее о размерах файла при сохранении в различных форматах.

Этой информации вполне достаточно при работе с документами формата А4. Углубляться в вопрос выбора форматов следует, если вы имеете дело со специфическими задачами: чертежи большого размера, фотографии высокого качества или значительные объемы документов. Не используйте редкие малораспространенные форматы, если планируете отправлять документы по электронной почте, так как у получателя могут возникнуть проблемы с просмотром прикрепленных документов. Хорошей идеей будет протестировать доступные графические форматы на предмет качества и размера файла при сохранении именно ваших документов.

Задачи, влияющие на выбор разрешения сканирования

Печать документов.

На выбор параметров оцифровки может повлиять необходимость печати электронных копий в будущем. Вне зависимости от формата изображения, оцифрованные фотографии и другие растровые графические изображения, состоят из сетки отдельных пикселей определенного цвета. Нельзя увеличить размер области печати без соразмерного уменьшения количества пикселей на единицу площади. Если известна разрешающая способность устройства печати, то можно определить максимально эффективный размер картинки, ограниченный с одной стороны аппаратными возможностями принтера (нет смысла отправлять на бумагу то, что принтер не в состоянии воспроизвести), с другой - объемом информации, содержащемся в #цифровом изображении.

Печать изображения с разрешением, равным максимальному разрешению принтера не всегда оправдана. Когда речь идет о печати цветных или полутоновых изображений разрешение может быть снижено без потери качества отпечатка. Это происходит из-за технологических ограничений, которые накладываются в случае лазерной или струйной печати. Каждая точка может быть только фиксированного цвета из набора расходных материалов. При #лазерной печати это, как правило, три цветных и один черно-белый картридж. И все многообразие цветов и полутонов получается растрированием изображения, неизбежно снижающим реальное разрешение в 3-4 раза. Таким образом, при печати на принтере, с максимальным разрешением 1200 #dpi (количество точек на дюйм), разрешение фотографии может не превышать 300-400 #ppi (количество пикселей на дюйм), и при большем разрешении фотографии улучшение качества отпечатка не происходит.

Распознавание текста

Если во время оцифровки документа или в последствии необходимо будет получить копию в текстовом формате, например, для последующего редактирования текста, то для этих целей используются программы распознавания текста OCR.

OCR
OCR

Требования для успешного распознавания, предъявляемые к графическому изображению текста:

  • одинаковое разрешения по вертикали и горизонтали;
  • рекомендованное разрешение 300 dpi;
  • при наличие текста менее 10 пунктов увеличить разрешение до 400 и более точек на дюйм.
  • использовать формат файла изображения без потери качества (например #TIFF), использование #JPEG нежелательно

Важное замечание: говоря про разрешение сканирования, имеется в виду оптическое или аппаратное разрешение сканера. Разрешение ниже рекомендованного, фон или плохое качество текста ведут к ошибкам распознавания. Избыточное качество не столько уменьшает вероятность появление ошибок, сколько замедляет время обработки документа.

-7

Рекомендуем ознакомиться с полным списком наших статей на Яндекс Дзене.