4 недели назад
Как работать с краулерами и анализаторами
Сайт — это не просто набор страниц, а целая вселенная, которую нужно правильно разложить по полочкам. Если структура сайта напоминает лабиринт с тупиками, поисковые краулеры быстро устанут там блуждать и могут упустить важный контент. Понимание, как работают эти «роботы-исследователи», поможет сделать сайт привлекательным для поисковиков и гарантировать быструю индексацию всех нужных страниц. Давайте разберёмся, как именно краулеры ходят по сайту и почему структура и внутренняя перелинковка — это не просто «модные слова», а залог успеха в SEO...
5 месяцев назад
ИИ-краулеры — это тараканы интернета, считают многие разработчики
ИИ-краулеры — это тараканы интернета, считают многие разработчики. Хотя любой сайт может стать мишенью для веб-краулеров, что иногда может привести к его падению из-за нагрузки, разработчики открытого кода «непропорционально» страдают от ИИ-краулеров. Проблема в том, что многие ИИ-боты не соблюдают Robots Exclusion Protocol и robot.txt. В январе разработчик FOSS описал, как AmazonBot без устали парсил Git-сервер, вызывая DDoS. Блокировать ИИ-краулеров бесполезно, потому что они лгут, меняют свой user agent, используют живые IP-адреса в качестве прокси и т.д. Они будут парсить ваш сайт, пока он не упадет, а потом будут обращаться к нему снова и снова...