2 года назад
Начало работы с BeautifulSoup: подробное руководство по парсингу веб-страниц с помощью Python
Вот простой пример того, как вы можете использовать BeautifulSoup для извлечения данных из HTML-страницы: В этом примере мы сначала делаем запрос к веб-сайту с помощью requestsбиблиотеки, а затем используем BeautifulSoup для анализа HTML-содержимого страницы. Наконец, мы находим первый h1 тег на странице с помощью findметода и печатаем его текстовое содержимое. BeautifulSoup — это популярная библиотека Python для просмотра веб-страниц, которая помогает извлекать данные из файлов HTML и XML. Он предоставляет...
238 читали · 3 года назад
Веб-скрейпинг с нуля на Python: библиотека Beautiful Soup
Источник: Nuances of Programming Данные есть везде, на каждом посещенном вами сайте. Чаще всего они уже представлены в читаемом текстовом формате, пригодном для использования в новом проекте, однако, несмотря на то, что нужный текст всегда можно скопировать и вставить прямо со страницы сайта, когда речь заходит о больших данных  —  о тексте с десятка тысяч веб-сайтов  —  скрейпинг приходит на помощь. Обучаться веб-скрейпингу (web-scraping) поначалу сложно, однако если вы начнете своё знакомство с большими данными, используя правильные инструменты, то предстоящий вам путь существенно облегчится...