Sitemap.xml – карта сайта, документ со служебной информацией, специальный xml файл и html страница, на которой указаны ссылки на все наиболее значимые страницы веб-ресурса.Хранитсяв корневой директории сервера. Сравнить файл можно с оглавлением книги. В нашем случае он также позволяет посетителям (поисковикам и пользователям интернета) с легкостью находить нужные страницы с минимальным количеством переходов.
Если речь идет о конструктивно простых проектах, то от главной страницы на любые другие можно попасть, как правило, сделав несколько кликов. Однако если сайт имеет сложную структуру, без sitemap.xml для него не обойтись. В противном случае портал окажется не очевидным для роботов и не удобным в использовании для пользователей.
Необходимость sitemap для сайта
Перед тем, как создать файл sitemap, необходимо понять, действительно ли он нужен ресурсу.
Содержание сайтмап
Мы уже сказали, что в навигационной карте указывается значимая для поисковиков служебная информация. Такая как:
- Сведения об альтернативных вариантах страниц;
- Информация о приоритетности страниц;
- Данные о том, как часто и когда в последний раз обновлялись страницы;
- Сведения о видеоматериалах и иллюстрациях, которые используются поисковыми роботами при формировании выдачи и индексировании веб-проекта;
- Вид размещенного контента, предположим, видеоролики или фото;
- Перечень и иерархия url страниц.
В особую категорию можно выделить HTML карты, предназначенные не для поисковиков, а для живых пользователей. Это каталоги страниц, на которых отражена их иерархия.
Можно ли отказаться от файла?
Да. Поисковики считают такой xml-документ не обязательным, а лишь рекомендованным инструментом. Если у вашего ресурса не будет сайтмап, например, Yandex отметит это как потенциально возможную, но не катастрофическую проблему.
Поисковые роботы будут индексировать сайты, даже не найдя адрес файла sitemap.xml. Однако зачастую из-за его отсутствия при индексации возникают лишние трудности. Как правило, в следующих случаях:
- Сайт начал работу совсем недавно или он вовсе новый;
- Проект «массивный» со сложной структурой;
- Страницы постоянно обновляются;
- Есть менее и более значимые страницы;
- На ресурсе есть страницы, на которые не ведут ссылки с прочих страниц сайта.
Важно! Если ваш веб-проект имеет коммерческую направленность, например, это интернет-магазин, количество пользователей которого определяет вашу прибыль, добавить файл sitemap вам следует обязательно.
В плане СЕО, file со служебными данными важен лишь потому, что способен ускорить и облегчить индексирование страниц. Возможно, поисковики проиндексируют их до того, как конкуренты похитят контент и поместят его на собственных сайтах.
Форматы документа
Составить файл sitemap для сайта можно в разных форматах:
- Документ в форматеxml будет содержать подробные и представленные в понятной для поисковика форме данные. Поэтому такой формат предпочтительнее. Строгих ограничений по числу ссылок нет. Создание sitemapxml особо рекомендуется для сайтов с сотнями и тысячами страниц равной важности, когда указание всех ссылок на них необходимо. В файл можно внести до 50 000 урл-ов, а также задать ориентировочный приоритет и частоту обновлений. Чаще всего сформировать sitemap хотят именно в xml.
- Карта представляет собой обычную страницу со ссылками на основные разделы site. Формат html рассчитан, в большей мере, не на поисковиков, а на интернет-пользователей. Количество ссылок ограничивается сотней. Если вы укажите более ста ссылок, то 101-ую ссылку на страницу роботы просто не проиндексируют. Более того, боты могут убрать эту страницу из поисковой выдачи из-за превышения количества урл-ов (пускай даже внутренних).
Важно!В текстовом документе кодировки UTF-8 каждый url файла sitemap нужно указывать с новой строки.
Другие форматы
Создать сайтмап в формате xml можно для новостей и иллюстраций:
- Для новостей. Позволяет быстро проиндексировать новости ресурса. Сайт необходимо вносить в каталог Гугл Новости. Требования к файлу: максимум 1 000 урл-ов, наличие URL-новостей, размещенных в последние несколько суток;
- Для иллюстраций. Создавайте отдельный документ для иллюстраций, если картинки не доступны для поисковых систем напрямую (допустим, они загружаются благодаря JavaScript).
Нередко для указания ссылок на иллюстрации используется основной сайтмап с урл-ами. Ничего критичного в этом нет.
Важные элементы sitemap.xml
Если вы хотите получить правильный документ, обратите особое внимание на следующие параметры:
- Url и loc – обязательные элементы, первый содержит информацию о конкретном урл-е, второй – представляет собой урл страницы с параметрами, которому требуется маскирование;
- Priority – важность страницы в сравнении с другими страницами ресурса. Параметр может варьироваться в пределах 0.0-1.0. С повышением важности урл-а, растет и его приоритет. Максимальный приоритет главной страницы должен быть равным 1 (по умолчанию составляет 0.5);
- Changefreq – указывает на рекомендуемую частоту обновления страницы (всегда, никогда, раз в неделю и т.д.);
- Lastmod — время и дата последнего обновления страницы. Параметр указывается в форматеDatetime. Однако допускается применение ГГГГ-ММ-ДД формата.
Навигационная карта носит рекомендательный характер по обходу страниц. То есть, вы можете задать периодичность обхода, например, раз в неделю. А поисковая система станет обходить страницы для индексации каждый час или день.
Важно! В файл нужно вписывать лишь те урл-ы, которые требуется проиндексировать. Документы с запрещенными для индексации данными в карте размещать не следует. Кроме того, в нее не вносят нестатические урл-ы и странички, содержащие теги.
Как создать?
Пошаговая инструкция того, как сделать сайтмап:
- Выберите канонические адреса, которые нужны в вашей карте.
- Определитесь с подходящим форматом документа.
- Выполнить формирование файла можно при помощи генератора Sitemap (автоматическое создание) или вручную. Посетив сервис Гугл (вам нужен раздел Справка), вы сможете найти перечень бесплатных и платных, офлайн и онлайн генераторов, которые способны автоматически создать sitemap.
Рассмотрим, как сформировать файл при помощи офлайн программы-генератора Majento:
- Парсите свой сайт.
- В приложении Majento выберите Генерировать Sitemap в меню Сайты.
- Выберите и сохраните необходимый формат.
- Сам файл готов. Осталось внести данные.
Хороший онлайн сервис для генерирования — xmlSitemapGenerator. Преимущества: есть возможность исключать и включать новые страницы, указывать определенные xml теги.
Использование CMS
Автоматически сформировать файл позволяют некоторые CMS. Например, ВордПресс:
- Скачайте и установите плагин Гугл xmlSitemaps;
- Выбирайте Настройки и подменю xmlsitemap;
- Выставляйте желаемые настройки. Приоритет можно оставить по умолчанию.
Путь документа: http://название сайта.ru/sitemap.xml. Имя файла можно выбрать по своему желанию (но не совершите ошибку, указывая к нему путь в robots.txt). А вот изменять расширение *.xml запрещено.
Правила составления карты в формате xml
Обязательные требования:
- Кодировка UTF-8;
- Использование специальных тегов, предоставляющих роботам доступ к файлу и оповещающих о том, что это именно сайтмап, а не иной документ;
- Загрузка в Гугл и Яндекс. Взять информацию о наличии sitemap откуда-то еще, боты не смогут. Инструкция по оповещению поисковиков будет предоставлена ниже;
- Указание адреса файла в robots.txt;
- Максимум 50 000 ссылок (если количество больше, формируйте несколько файлов и включайте в основную карту).
Максимальный «вес» — 10 Мб.
Как «рассказать» роботам о sitemap?
Где рассказать о том, что вы создали навигационную карту для Яндекса и других поисковиков? Рассмотрим на примере Yandex:
- В файл robots.txt включите директиву sitemap. Вид кодировки:
Sitemap: http://НазваниеВашегоСайта.ru/sitemap.xml
- Альтернативный вариант: используйте сервис ЯндексВебмастер. Укажите ссылку (адрес) на sitemap в разделе Файлы Sitemap в меню Настройка индексирования.
Также как Яндекс, вы можете известить Гугл. Путь: Файлы Sitemap в подразделе Сканирование в Панели инструментов для вебмастеров. В справке Гугла можно найти полную инструкцию по этому вопросу.