Найти тему

Что такое парсинг сайтов?


Парсинг сайтов - это автоматизированный сбор информации с того или иного сайта посредством просмотра его исходного кода.Допустим вы хотите получить ссылки со страницы новостей, для этого вам понадобиться спарсить эту страницу и из её элементов html достать элементы <a из которых забрать значения из href которыми и являются ссылки.

Ну а чтобы получить доступ к самому html какой либо страницы вам понадобиться использовать соответствующие библиотеки.Допустим Beautiful Soup или lxml в Python.

Считается что уметь парсить сайты должен уметь каждый уважающий себя разработчик, ну или по крайней мере тот, кому зачастую приходиться заработать работая во freelanc.Ведь такие заказы там бывают часто, а платят всё равно прилично.А учитывая что существуют удобные библиотеки благодаря которым ваш код много строк не займёт это идеальный вариант немного подзаработать.
Около минуты