1 месяц назад
Как спарсить сайт с помощью SiteAnalyzer, если он защищен CDN Cloudflare от сканирования ботами?
Это возможно. Что для этого понадобится? 1. Терпение. Такие сайты будут долго сканироваться. 2. Google Chrome и владение пользованием Dev Tools. 3. Понимание, что такое HTTP заголовки, Cookies и параллельные треды HTTP запросов. В чем проблема? Cloudflare позволяет настраивать сайтам защиту от ботов, что мешает анализировать эти сайты разным SEO-тулзам. Особенно это касается тулов, не уважающих robots.txt, или сами боты малоизвестны. Например, условный Ahrefs или SemRush может иметь доступ к контенту сайта, но условный Serpstat увидит только 403 кода статуса (в доступе запрещен)...
2227 читали · 4 года назад
Как парсить сайт - инструкция «для чайников»
Парсинг нужен, чтобы получить с сайтов открытую информацию. К примеру, цены, фотографии или полностью каталог товаров. Для этой задачи нужны специальные инструменты. Расскажем о том, как спарсить информацию...