Парсинг веб-страниц по URL в PDF на Python #python #программирование #code
Delphi парсер новостей с сайта
В этой статье напишем парсер новостей с сайта. Код конечно можно было оптимизировать например процедурами или функциями. Все писалось на скорую руку. Если будут проблемы с SSL попробуйте установить https://disk.yandex.ru/d/pY3vi7PhtmdJRg Запускаем Delphi создаем VCL Appplication. Новости будем брать тут https://oblast45.ru/news Кидаем на форму memo, image, idhttp, button. Первым делом нам нужно получить ссылку на самую верхнюю новость на сайте. Для этого нам нужно получить HTML страницы со списком новостей...
🗃️ Парсинг PDF-файлов: почему это так сложно и как выжить в «PDF-болоте»
Каждый разработчик рано или поздно сталкивается с необходимостью парсинга PDF-файлов. И вот он, полный энтузиазма, открывает спецификацию формата, думая: «Ну что тут может быть сложного?». Однако на практике всё оказывается не так просто. PDF – это не спецификация, а, скорее, «социальный договор», в котором строгие правила существуют лишь условно, а каждый файл живёт своей жизнью. Элиот Джонс в своей статье подробно описал все мучения, через которые ему пришлось пройти при парсинге почти четырёх тысяч PDF-файлов...