4103 читали · 6 лет назад
Парсинг страниц на Python. Parser на Python
Статья подготовлена для студентов курса «Разработчик Python» в образовательном проекте OTUS. Рано или поздно любой Python-программист сталкивается с задачей скопировать какой-нибудь материал с сайта. Так как страниц на нём достаточно много, терять время на ручное копирование — не самый лучший выход. К тому же, языки программирования затем и нужны, чтобы избавлять нас от рутинной работы, автоматизируя решение различных задач. Если же говорить о работе с HTML, то в Python есть отличные библиотеки для этого...
1027 читали · 8 месяцев назад
Парсинг страниц Python: полное руководство по сбору данных с сайтов
Парсинг страниц python — это процесс автоматического извлечения информации с веб-сайтов с помощью скриптов, написанных на языке программирования Python. Этот метод позволяет собирать большие объемы данных, которые представлены в открытом виде, но не имеют удобного интерфейса для скачивания (API). Представьте, что вам нужно получить цены на тысячи товаров из интернет-магазина или собрать заголовки новостей с десятка порталов. Вручную это займет недели, а скрипт справится за минуты. Именно для таких задач и применяется веб-скрапинг...