1 год назад
Парсинг данных с сайта за 5 минут: Python + BeautifulSoup 🌐
Интернет переполнен данными, и часто возникает необходимость извлекать их с веб-страниц для своих задач. В этой статье мы разберём, как с помощью Python и библиотеки BeautifulSoup можно быстро и просто спарсить данные с сайта. моя телега pip install requests beautifulsoup4 import requests from bs4 import BeautifulSoup import re # Функция для транслитерации с кириллицы на латиницу def translit(text): alphabet = { 'а': 'a', 'б': 'b', 'в': 'v', 'г': 'g', 'д': 'd', 'е': 'e', 'ё': 'e', 'ж': 'zh', 'з':...
1 неделю назад
Парсинг сайтов на Python
bash pip install requests beautifulsoup4 selenium scrapy lxml python import requests from bs4 import BeautifulSoup import time # Базовый парсинг с заголовками headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36' } try: response = requests.get('https://example.com', headers=headers, timeout=10) response.raise_for_status() # Проверка на ошибки soup = BeautifulSoup(response.text, 'html.parser') # Поиск элементов titles = soup.find_all('h1') links = soup.find_all('a', class_='some-class') text = soup.find('div', id='content')...