1805 читали · 3 года назад
Шпаргалка по Selenium WebDriver 4 + Python
Всех приветствую. Каких-то эксклюзивных материалов тут не будет. Просто, сам хочу более подробно разобраться в этом инструменте. В большинстве случаев за глаза хватает библиотеки Requests, но, иногда, необходимая информация на сайте появляется только после выполнения скриптов, в этих случаях без "эмулятора" браузера ничего не сделать... Ну, на мой непрофессиональный взгляд. В 4 версии Селениума много обновлений, а большинство русскоязычных материалов по 2 и 3 части этой программы (тут уж, библиотекой, язык не поворачивается назвать)...
2 года назад
Как парсить через python?
Вы можете использовать библиотеку BeautifulSoup для парсинга следующих элементов страницы: - Текст - Изображения - Таблицы - Формы - Ссылки - Заголовки - Списки - Комментарии - Метаданные Для парсинга текста вы можете использовать следующий код: ```python from bs4 import BeautifulSoup import requests url = 'https://example.com' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') # Получить все тексты на странице texts = soup.find_all('p') for text in texts:    print(text.text) ``` Для парсинга изображений вы можете использовать следующий код: ```python from bs4 import BeautifulSoup import requests url = 'https://example...