1963 читали · 2 года назад
​Методы обхода защиты от автоматизированного ПО в браузере Chrome под управлением Selenium в Python При парсинге данных возникают ситуации, когда нужно получить доступ к сайту с помощью драйвера selenium. Так как на странице сайта в коде выполняются скрипты, которые добавляют в код данные, доступ к которым с помощью обычных запросов получить просто не получиться. Но, все может быть немного печальнее. К примеру, страница может находиться за CDN, такой как Cloudflare, с включенной проверкой браузера. В этом случае обычный драйвер selenium доступ к странице не получит, так как будет определено, что используется автоматизированное тестовое ПО. Но, даже в этих случаях выход есть. Давайте посмотрим, как можно обойти данную проверку с помощью отключения определенных опций в браузере, а также рассмотрим уже модифицированную версию драйвера для Chrome, в которой уже из коробки отключены данные опции. Но, обо всем по порядку. 📌 Читать далее #programming #python #parsing
3 месяца назад
Обход защиты Cloudflare: Комплексное техническое исследование для парсинга
Прежде чем приступать к анализу методов обхода, необходимо глубоко понять, с чем именно сталкивается веб-парсер. Защита Cloudflare — это не единый барьер, а сложная, многоуровневая и глубоко интегрированная система обороны. Этот раздел посвящен детальному разбору каждого эшелона этой защиты, начиная от периметра сети и заканчивая браузером конечного клиента. Понимание архитектуры и логики работы этих механизмов является ключом к разработке эффективных стратегий их преодоления. Фундаментальная сила Cloudflare заключается в его базовой архитектуре. Каждый последующий уровень безопасности является надстройкой над этой основой...