В одном из недавних официальных видео команда Google раскрыла больше подробностей о том, как качество контента влияет на индексацию.
Вот основные факты:
- Google учитывает качество контента и страницы во время индексации, чтобы определить место в выдаче.
- Контент более высокого качества обходится роботами чаще.
- Оптимизация HTML-структуры и контента влияют на индексацию сайта.
Качество — основной фактор, влияющий на частоту переобхода и переиндексации
Во время индексации Google оценивает текстовую информацию, теги, атрибуты, изображения и видео. На этом этапе Google рассчитывает разные сигналы, которые определяют качество страницы и ее позиции в выдаче. Гэри Илш указывает:
На заключительном этапе индексирования принимается решение, стоит ли включать страницу в индекс Google. Во многом это зависит от качества страницы и ранее рассчитанных сигналов.
Это объясняет, почему технически корректные страницы часто не попадают в индекс Google.
Ранее Илш также указывал, что частота переобхода страниц зависит от качества. Основная задача Google — снизить объемы страниц для переобхода:
Чтобы поисковый бот чаще переобходил страницы сайта, вам надо доказать, что контент стоит того.
Как Google оценивает разные сигналы страниц
Некоторые из сигналов достаточно просты, например, атрибут rel= “canonical”, тогда как важность страницы — более сложный для оценки сигнал.
В отношении дублированных страниц (с мало отличающимся контентом) Google применяет кластеризацию. В кластере определяется каноническая страница (по совокупности ранее рассчитанных сигналов). Именно она и попадет в индекс и выдачу.
Что еще важно знать для индексации
Если в элементе <head> используется неподдерживаемый тег, это может привести к проблемам индексирования страницы.
При оценке страницы Google ориентируется на основной контент. Это доказывает, что техническая оптимизация страницы менее важна для индексирования, чем качество контента.
По словам Илша, индекс Google хранится на тысячах компьютеров, поэтому поиск работает над сокращением количества индексируемых страниц.