Боты. Они повсюду. И в ваших данных они тоже оставили свой след. Какие способы идентификации ботов поддерживаются в веб-аналитике Adobe?
Активируйте Adobe Analytics IAB бот-фильтр
Фильтр позволит исключить “честных” ботов, т.е. тех, которые представляются “по имени". Для идентификации используется значение http-user-agent.
Настройте бот-фильтры по IP-адресам
Узнайте у IT-коллег, какие сервисы используются для проверки сайта на уязвимости, доступность, и пр. Возможно, используются боты без явной идентификации. В этом случае, настройте бот-фильтры по IP. Перед тем, как перечислять IP-адреса, обязательно проверьте, не активирована ли настройка удаления последнего октета IP-адреса на уровне репорт свита. От этого будет зависеть, в каком формате необходимо настроить фильтр для бота.
Первые два способа помогают успешно детектировать “простых” ботов. Но их, как правило, не достаточно. Умные сложные боты успешно маскируются по своим признакам и поведению.
Подходы для детектирования умных ботов в Adobe Analytics
- Нахождение паттерна по атрибутам и создание исключающего сегмента. Проанализируйте местоположение, время и частоту визитов, тип и версию устройства, тип и версию браузера, домен сервера и другие признаки.
- Скорринговые модели, построенные на сырых данных. Этот подход выходит за рамки инфраструктуры Adobe, т.к. данные обрабатываются в отдельном стеке решений (например, с помощью R/Python). Результат загружается в Adobe Analytics в виде признака, на основе которого опять же создается исключающий сегмент.
Кстати, бот-трафик не исключается из объема сервер-коллов, за которые приходит инвойс.
Подборка ссылок по теме:
Расскажите, как вы боретесь с ботами? Какой процент трафика они занимают в ваших репорт свитах? Какие самые популярные? Используете ли вы скорринговые модели для их детектирования?
P.S.: Присоединяйтесь к сообществу Adobe в Telegram.