Найти тему
Блог Exla

Всё о Sitemap.xml

Оглавление

Sitemap.xml – карта сайта, документ со служебной информацией, специальный xml файл и html страница, на которой указаны ссылки на все наиболее значимые страницы веб-ресурса.Хранитсяв корневой директории сервера. Сравнить файл можно с оглавлением книги. В нашем случае он также позволяет посетителям (поисковикам и пользователям интернета) с легкостью находить нужные страницы с минимальным количеством переходов.

Если речь идет о конструктивно простых проектах, то от главной страницы на любые другие можно попасть, как правило, сделав несколько кликов. Однако если сайт имеет сложную структуру, без sitemap.xml для него не обойтись. В противном случае портал окажется не очевидным для роботов и не удобным в использовании для пользователей.

Необходимость sitemap для сайта

Перед тем, как создать файл sitemap, необходимо понять, действительно ли он нужен ресурсу.

Содержание сайтмап

Мы уже сказали, что в навигационной карте указывается значимая для поисковиков служебная информация. Такая как:

  • Сведения об альтернативных вариантах страниц;
  • Информация о приоритетности страниц;
  • Данные о том, как часто и когда в последний раз обновлялись страницы;
  • Сведения о видеоматериалах и иллюстрациях, которые используются поисковыми роботами при формировании выдачи и индексировании веб-проекта;
  • Вид размещенного контента, предположим, видеоролики или фото;
  • Перечень и иерархия url страниц.

В особую категорию можно выделить HTML карты, предназначенные не для поисковиков, а для живых пользователей. Это каталоги страниц, на которых отражена их иерархия.

Можно ли отказаться от файла?

Да. Поисковики считают такой xml-документ не обязательным, а лишь рекомендованным инструментом. Если  у вашего ресурса не будет сайтмап, например, Yandex отметит это как потенциально возможную, но не катастрофическую проблему.

Поисковые роботы будут индексировать сайты, даже не найдя адрес файла sitemap.xml. Однако зачастую из-за его отсутствия при индексации возникают лишние трудности. Как правило, в следующих случаях:

  • Сайт начал работу совсем недавно или он вовсе новый;
  • Проект «массивный» со сложной структурой;
  • Страницы постоянно обновляются;
  • Есть менее и более значимые страницы;
  • На ресурсе есть страницы, на которые не ведут ссылки с прочих страниц сайта.

Важно! Если ваш веб-проект имеет коммерческую направленность, например, это интернет-магазин, количество пользователей которого определяет вашу прибыль, добавить файл sitemap вам следует обязательно.

В плане СЕО, file со служебными данными важен лишь потому, что способен ускорить и облегчить индексирование страниц. Возможно, поисковики проиндексируют их до того, как конкуренты похитят контент и поместят его на собственных сайтах.

Форматы документа

Составить файл sitemap для сайта можно в разных форматах:

  • Документ в форматеxml будет содержать подробные и представленные в понятной для поисковика форме данные. Поэтому такой формат предпочтительнее. Строгих ограничений по числу ссылок нет. Создание sitemapxml особо рекомендуется для сайтов с сотнями и тысячами страниц равной важности, когда указание всех ссылок на них необходимо. В файл можно внести до 50 000 урл-ов, а также задать ориентировочный приоритет и частоту обновлений. Чаще всего сформировать sitemap хотят именно в xml.
  • Карта представляет собой обычную страницу со ссылками на основные разделы site. Формат html рассчитан, в большей мере, не на поисковиков, а на интернет-пользователей. Количество ссылок ограничивается сотней. Если вы укажите более ста ссылок, то 101-ую ссылку на страницу роботы просто не проиндексируют. Более того, боты могут убрать эту страницу из поисковой выдачи из-за превышения количества урл-ов (пускай даже внутренних).

Важно!В текстовом документе кодировки UTF-8 каждый url файла sitemap нужно указывать с новой строки.

Другие форматы

Создать сайтмап в формате xml можно для новостей и иллюстраций:

  • Для новостей. Позволяет быстро проиндексировать новости ресурса. Сайт необходимо вносить в каталог Гугл Новости. Требования к файлу: максимум 1 000 урл-ов, наличие URL-новостей, размещенных в последние несколько суток;
  • Для иллюстраций. Создавайте отдельный документ для иллюстраций, если картинки не доступны для поисковых систем напрямую (допустим, они загружаются благодаря JavaScript).

Нередко для указания ссылок на иллюстрации используется основной сайтмап с урл-ами. Ничего критичного в этом нет.

Важные элементы sitemap.xml

Если вы хотите получить правильный документ, обратите особое внимание на следующие параметры:

  • Url и loc – обязательные элементы, первый содержит информацию о конкретном урл-е, второй – представляет собой урл страницы с параметрами, которому требуется маскирование;
  • Priority – важность страницы в сравнении с другими страницами ресурса. Параметр может варьироваться в пределах 0.0-1.0. С повышением важности урл-а, растет и его приоритет. Максимальный приоритет главной страницы должен быть равным 1 (по умолчанию составляет 0.5);
  • Changefreq – указывает на рекомендуемую частоту обновления страницы (всегда, никогда, раз в неделю и т.д.);
  • Lastmod — время и дата последнего обновления страницы. Параметр указывается в форматеDatetime. Однако допускается применение ГГГГ-ММ-ДД формата.

Навигационная карта носит рекомендательный характер по обходу страниц. То есть, вы можете задать периодичность обхода, например, раз в неделю. А поисковая система станет обходить страницы для индексации каждый час или день.

Важно! В файл нужно вписывать лишь те урл-ы, которые требуется проиндексировать. Документы с запрещенными для индексации данными в карте размещать не следует. Кроме того, в нее не вносят нестатические урл-ы и странички, содержащие теги.

Как создать?

Пошаговая инструкция того, как сделать сайтмап:

  • Выберите канонические адреса, которые нужны в вашей карте.
  • Определитесь с подходящим форматом документа.
  • Выполнить формирование файла можно при помощи генератора Sitemap (автоматическое создание) или вручную. Посетив сервис Гугл (вам нужен раздел Справка), вы сможете найти перечень бесплатных и платных, офлайн и онлайн генераторов, которые способны автоматически создать sitemap.

Рассмотрим, как сформировать файл при помощи офлайн программы-генератора Majento:

  • Парсите свой сайт.
  • В приложении Majento выберите Генерировать Sitemap в меню Сайты.
  • Выберите и сохраните необходимый формат.
  • Сам файл готов. Осталось внести данные.

Хороший онлайн сервис для генерирования — xmlSitemapGenerator. Преимущества: есть возможность исключать и включать новые страницы, указывать определенные xml теги.

Использование CMS

Автоматически сформировать файл позволяют некоторые CMS. Например, ВордПресс:

  • Скачайте и установите плагин Гугл xmlSitemaps;
  • Выбирайте Настройки и подменю xmlsitemap;
  • Выставляйте желаемые настройки. Приоритет можно оставить по умолчанию.

Путь документа: http://название сайта.ru/sitemap.xml. Имя файла можно выбрать по своему желанию (но не совершите ошибку, указывая к нему путь в robots.txt). А вот изменять расширение *.xml запрещено.

Правила составления карты в формате xml

Обязательные требования:

  • Кодировка UTF-8;
  • Использование специальных тегов, предоставляющих роботам доступ к файлу и оповещающих о том, что это именно сайтмап, а не иной документ;
  • Загрузка в Гугл и Яндекс. Взять информацию о наличии sitemap откуда-то еще, боты не смогут. Инструкция по оповещению поисковиков будет предоставлена ниже;
  • Указание адреса файла в robots.txt;
  • Максимум 50 000 ссылок (если количество больше, формируйте несколько файлов и включайте в основную карту).

Максимальный «вес» — 10 Мб.

Как «рассказать» роботам о sitemap?

Где рассказать о том, что вы создали навигационную карту для Яндекса и других поисковиков? Рассмотрим на примере Yandex:

  • В файл robots.txt включите директиву sitemap. Вид кодировки:

Sitemap: http://НазваниеВашегоСайта.ru/sitemap.xml

  • Альтернативный вариант: используйте сервис ЯндексВебмастер. Укажите ссылку (адрес) на sitemap в разделе Файлы Sitemap в меню Настройка индексирования.

Также как Яндекс, вы можете известить Гугл. Путь: Файлы Sitemap в подразделе Сканирование в Панели инструментов для вебмастеров. В справке Гугла можно найти полную инструкцию по этому вопросу.