Файл robots.txt представляет собой текстовый документ, созданный для обмена информацией между веб-пауками (поисковыми системами, роботами и аналогичными сущностями) и вашим веб-сайтом. В этом файле содержатся директивы, предназначенные для веб-пауков, которые определяют, какие страницы следует индексировать, а какие следует исключить из процесса обхода. Взглянем на пример простого файла robots.txt:
User-agent: *
Disallow: /Сюда перечисляется содержимое, которое нужно скрыть от индексации разнообразными поисковыми системами
User-agent: Yandex
Disallow: /В данной части вы указываете информацию, которую не должен видеть поисковый робот Yandex
Host: вашсайт.ru / Укажите свой домен
Sitemap: https:// Вставьте ссылку на вашу карту сайта
Инструкции по интеграции карты сайта в файл robots.txt следующие:
Откройте файл robots.txt и добавьте строку, указывающую на расположение вашей карты сайта. Давайте рассмотрим файл по частям:
User-agent: * дает понять, что последующие указания применяются