Одним из направлений в ИТ, куда можно войти относительно просто – это парсинг сайтов и парсинг данных. Для начала разберемся в терминологии. Сейчас под парсингом понимают сбор данных с сайтов или интернет - магазинов и последующая его выгрузка и использование каким – либо образом, будь-то анализ цены, сравнение с конкурентами, маркетинговый анализ и т.д. Однако, строго говоря, этот процесс правильно разделить на две составляющие: 1. Скрапинг (англ. Scraping – соскабливание, выскребание) 2. Парсинг (анг. Parsing – разбор, анализ) Скрапинг данных – это как раз процесс «добычи» или выскребания данных с сайтов. Поверьте, термин «выскребание» я бы заменил на «выцарапывание» — это более живое слово, наиболее точно отражающее процесс. Так как почти все современные сайты совершенно не спешат просто так отдавать данные, причин тому много, от понятного нежелание легко делится данными, до защиты от DDOS атак, которые в значительной степени похожи на парсинг. Я бы даже сказал, что процесс скрапинг
Парсинг сайтов: быстрый старт
28 января 202428 янв 2024
3
2 мин