453 читали · 5 лет назад
HTML парсер на Python
Учитывая современное развитие Интернета, было бы кощунством не написать приложение, взаимодействующее со всемирной паутиной. Сегодня мы напишем простенький html-парсер на Python. Наше приложение будет читать код указанной страницы сайта и сохранять все ссылки в ней в отдельный файл. Это приложение может помочь SEO-аналитикам и веб-разработчикам. Писать будем на Python 3, в котором есть встроенный класс для html-парсера из модуля html.parser from html.parser import HTMLParser Так же нам понадобится функция urlopen из модуля urllib from urllib...
1 месяц назад
Пишем свой парсер на Python: собираем данные с сайтов красиво
— или как почувствовать себя цифровым Шерлоком Парсинг — это искусство и наука одновременно. Это когда ты заходишь не с фронта, а по-честному — через requests и BeautifulSoup, и вежливо просишь у сайта: “А ну-ка дай сюда все цены на ноутбуки… желательно без нервов”. 🤓 В этой статье ты научишься: pip install requests beautifulsoup4 pandas lxml openpyxl selenium (И, если нужно Selenium: скачай chromedriver → положи рядом с кодом) Собрать названия и цены кофе с условного сайта. import requests from bs4 import BeautifulSoup # Отправляем GET-запрос url = "https://example-coffee-shop...