PostgreSQL: регулярные выражения. Запрос на SQL.
Программирование на Python. Простейший парсинг web-страниц (библиотека requests, регулярные выражения)
Снова на моем канале Old Programmer . Тематическое оглавление его найдете здесь . А здесь все мои материалы о языке программирования Python. Несколько полезных ссылок с моего канала Сегодня интересный материал о том, как в принципе, можно анализировать ту информацию, который вы получаете в запросах к сайту с помощью известной уже нам библиотеки requests . Для анализа html страниц прямо напрашивается использовать регулярные выражения, которым я уже посвятил несколько статей. Определения заголовка...
Извлечение данных из HTML и XML документов с помощью Beautiful Soup
Beautiful Soup - это Python библиотека, которая используется для парсинга HTML и XML документов. С помощью Beautiful Soup можно извлекать данные из веб-страниц, такие как заголовки, текст, ссылки, изображения и многое другое. Для начала работы с Beautiful Soup, необходимо установить эту библиотеку в своем проекте. Для этого можно использовать менеджер пакетов pip: После установки Beautiful Soup можно начать использовать эту библиотеку для извлечения данных из HTML и XML документов. Например, следующий...