Найти тему

Web Scraping: Отчет о деятельности Красного Креста

Есть на просторах интернета документ интересный:

http://pdfview.tonb.ru:8088/Default.aspx?bd=EI&mfn=10407

Отчет о деятельности Тобольского местного управления Российского общества Красного Креста, Тобольской Николаевской общины сестер милосердия и уездных комитетов за 1914 год.

Висит груша, нельзя скушать.. Куды ж податься бедному крестьянину, если возжелает он, ничтоже сумняшеся, скачать себе на компьютер это сокровище, все 152 его странички? Оказывается, не так это просто (для меня). Посему и хочу поделиться своими мучениями и их их изучением.

Во-первых строках, раз уж документ этот открыт в браузере (в моем случае - это Яндекс-браузер), давайте-ка нажмем кнопку F12 (это инструмент разработчика).

-2

Далее нажимаем кнопку Первая, чтобы загрузилась первая страница. В нижней части экрана (в инструменте разработчика) выбираем вкладку Sources. В левой части инструмента раскрываем папку temp.

-3

Мы теперь видим, что в правой части появился скан страницы - это дубль скана. Преимущество дубля в том, что правая кнопка мышки на оригинале не действует, а на дубле - появляется выпадающее меню. Выбираем в этом меню пункт Save image as. В результате скан сохранится в папку, которая в настройках браузера выбрана для загрузки.

Далее в цикле повторяем эти действия 151 раз (поскольку всего сканов 152), но первое из действий теперь - не кнопка Первая, а кнопка Следующая

-4

Дальше остается только перенести эти 152 скана в подходящую папку и переименовать их (отсортировав по возрастанию времени) по шаблону, например, 1914-001.png .. 1914-152.png.

Таким же методом можно скачать отчеты Тобольского управления РОКК и за другие годы.

Например, за 1904 год

Подписаться на канал Математика и программирование
Вокруг ЕГЭ: разложить x^5+1 на множители с вещественными коэффициентами
Web Scraping: преобразовать иерархическую структуру в табличную
Web Scraping: преобразовать табличную структуру в иерархическую
Web Scraping: всероссийская перепись 1917
Как я поженил Лагранжа и сигмоиду
Интерполяция функций и правило Лопиталя

Подписаться на канал Новости из царской России
VisualStudioCode. html. Урок 1
Вокруг ЕГЭ: разложить x^5+1 на множители с вещественными коэффициентами
Web Scraping: преобразовать иерархическую структуру в табличную
Web Scraping: преобразовать табличную структуру в иерархическую
Web Scraping: всероссийская перепись 1917
Как я поженил Лагранжа и сигмоиду

Оглавление статей канала "Новости из царской России"

YouTube "Новости из царской России"

Обсудить в групповом чате

News from ancient Russia

Персональная история русскоязычного мира