5 месяцев назад
🗃️ Парсинг PDF-файлов: почему это так сложно и как выжить в «PDF-болоте»
Каждый разработчик рано или поздно сталкивается с необходимостью парсинга PDF-файлов. И вот он, полный энтузиазма, открывает спецификацию формата, думая: «Ну что тут может быть сложного?». Однако на практике всё оказывается не так просто. PDF – это не спецификация, а, скорее, «социальный договор», в котором строгие правила существуют лишь условно, а каждый файл живёт своей жизнью. Элиот Джонс в своей статье подробно описал все мучения, через которые ему пришлось пройти при парсинге почти четырёх тысяч PDF-файлов...
160 читали · 2 года назад
А ну-ка, кто ещё не умеет искать слово на веб-странице?
Одно из главных достоинств цифровых текстов — возможность за считанные секунды найти нужное место по ключевому слову, вместо того чтобы самому листать длинный документ в поисках информации. На компьютерной клавиатуре для этого достаточно нажать комбинацию клавиш Ctrl+F и в появившемся окошке начать печатать слово. Чтобы комбинация сработала, переводить клавиатуру на английский язык не нужно. Не хочется читать здоровенный пост целиком, а важно узнать лишь размер готовой вышивки, о которой он написан?...