Есть на просторах интернета документ интересный: http://pdfview.tonb.ru:8088/Default.aspx?bd=EI&mfn=10407 Отчет о деятельности Тобольского местного управления Российского общества Красного Креста, Тобольской Николаевской общины сестер милосердия и уездных комитетов за 1914 год. Висит груша, нельзя скушать.. Куды ж податься бедному крестьянину, если возжелает он, ничтоже сумняшеся, скачать себе на компьютер это сокровище, все 152 его странички? Оказывается, не так это просто (для меня). Посему и хочу поделиться своими мучениями и их их изучением. Во-первых строках, раз уж документ этот открыт в браузере (в моем случае - это Яндекс-браузер), давайте-ка нажмем кнопку F12 (это инструмент разработчика). Далее нажимаем кнопку Первая, чтобы загрузилась первая страница. В нижней части экрана (в инструменте разработчика) выбираем вкладку Sources. В левой части инструмента раскрываем папку temp. Мы теперь видим, что в правой части появился скан страницы - это дубль скана. Преимущество дубля в
Web Scraping: Отчет о деятельности Красного Креста
16 июня 202116 июн 2021
7
2 мин