Мы проанализировали 1000 доменов на наличие бот-трафика. В выборку попали сайты новостного формата — чтобы не было искажений. Почему именно эта выборка? На информационниках очень активно обучаются языковые модели. Пятёрка самых активных ИИ-ботов за 3 месяца: Facebook - 34 502 888 запросов Bytespider (TikTok) - 10 286 154 запросов Huawei - 10 045 766 запросов GPTBoot - 8 653 502 запросов Amazon Bot - 6 477 078 запросов Claude Bot - 4 728 798 запросов Причём они посещают все 1000 сайтов, давая колоссальную нагрузку. В среднем по нашей статистике на сайт ежедневно заходит от 50 до 200 разных ботов. У нас в базе больше 500 ботов, из них реальную нагрузку дают чуть больше половины. Причём несколько раз в месяц попадаются новые неидентифицированные боты, которые вручную приходится идентифицировать. К примеру, парсеры и архиваторы: Heritrix (веб-архиватор) - 769 350 запросов WebScraper Bot - 512 438 запросов Начиная от поисковых ботов, заканчивая парсерами типа Ahrefs, Semrush, ИИ-агентами.
136 млн запросов от ботов, 1000 доменов в анализе, 3 месяца наблюдений — всё что нужно знать о бот-трафике
18 июня18 июн
2
3 мин