Это возможно. Что для этого понадобится? 1. Терпение. Такие сайты будут долго сканироваться.
2. Google Chrome и владение пользованием Dev Tools.
3. Понимание, что такое HTTP заголовки, Cookies и параллельные треды HTTP запросов. В чем проблема? Cloudflare позволяет настраивать сайтам защиту от ботов, что мешает анализировать эти сайты разным SEO-тулзам. Особенно это касается тулов, не уважающих robots.txt, или сами боты малоизвестны. Например, условный Ahrefs или SemRush может иметь доступ к контенту сайта, но условный Serpstat увидит только 403 кода статуса (в доступе запрещен). Поэтому, когда вы сканируете сайт с помощью SiteAnalyzer, то Cloudflare детектирует вас как неверифицированного бота, поэтому страницы будут отдавать 403 код статуса. Список ботов, которые верифицированы Cloudflare, можно найти здесь: https://radar.cloudflare.com/traffic/verified-bots
Кроме блокировки на уровне ботов, еще в Cloudflare есть защита от DDOS атак, а также ограничения по частоте парсинга, повышающ