1K подписчиков
Доброго времени суток, читатели, зрители моего канала programmer's notes. Не забывайте подписываться и писать свои комментарии к моим статьям и видео. Использование библиотеки BeautifulSoup для парсинга html-страниц Нам уже приходилось разбирать html-страницу. Мы использовали библиотеку html.parser. Сегодня рассмотрим библиотеку BeautifulSoup, которая просто идеально подходит для работы с html. Компоненты библиотеки устанавливаются командами (для Windows просто pip) pip3 install lxml pip3 install...
2 месяца назад
6K подписчиков
Снова на моем канале Old Programmer. Тематическое оглавление его найдете здесь. А здесь все мои материалы о языке программирования Python. Сегодня замечательная тема - библиотека BeautifulSoup. Она, в частности, очень удобна для анализа html-страниц. Мы посвятим этой библиотеке две статьи...
3 года назад
9,3K подписчиков
Парсинг веб-страниц Парсинг веб-страниц (scraping) нужен для многих целей: от борьбы с сервисами, которые не предоставляют API, до создания поисковых систем. Для демонстрации мы извлечем заголовки новостей с главной страницы журнала. C помощью библиотеки requests и парсера HTML BeautifulSoup мы можем сделать это всего в несколько строк. Установим библиотеки: pip3 install requests beautifulsoup4. Теперь откроем xakep.ru в отладчике браузера и увидим, что заголовки...
2 года назад