Снова на моем канале Old Programmer . Тематическое оглавление его найдете здесь . А здесь все мои материалы о языке программирования Python. Несколько полезных ссылок с моего канала Сегодня интересный материал о том, как в принципе, можно анализировать ту информацию, который вы получаете в запросах к сайту с помощью известной уже нам библиотеки requests . Для анализа html страниц прямо напрашивается использовать регулярные выражения, которым я уже посвятил несколько статей. Определения заголовка html-страницы Рассмотрим не слишком сложную задачу: скачать страницу по указанному адресу и определить ее заголовок. Программа rgp4000.py спрашивает на входе url (url = input().strip()) и выводит заголовок страницы. При при этом страница сохраняется на диске под именем test.html, и может таким образом подвергаться дальнейшему анализу. Для поиска используется функция из библиотеки re - findall(). Обращаю также внимание на параметр flags=re.I, означающий не чувствительность при по
Программирование на Python. Простейший парсинг web-страниц (библиотека requests, регулярные выражения)
2 февраля 20212 фев 2021
369
1 мин