Найти в Дзене

Показания сотрудника Google дают представление о системе ранжирования Google

Недавнее свидетельство инженера Google предоставило уникальное понимание системы ранжирования Google и подтвердило использование сигнала популярности, основанного на данных браузера Chrome. Эти сведения могут изменить представление об оптимизации веб-страниц и о том, как они оцениваются в поисковой выдаче. На опубликованных показаниях инженера Google, представленных Министерством юстиции США, открывается возможность заглянуть в механизмы работы системы ранжирования. Они предоставляют понимание показателей качества, а также знакомят с таинственным сигналом популярности, основанным на данных браузера Chrome. Документ содержит общий обзор факторов ранжирования важных для поискового продвижения, раскрывая основные принципы работы алгоритмов, но избегая деталей их внутренней структуры. Например, он начинается с раздела о «ручной обработке» сигналов, в котором описывается общий процесс сбора данных от оценщиков качества, кликов и так далее и применения математических и статистических формул
Оглавление

Недавнее свидетельство инженера Google предоставило уникальное понимание системы ранжирования Google и подтвердило использование сигнала популярности, основанного на данных браузера Chrome. Эти сведения могут изменить представление об оптимизации веб-страниц и о том, как они оцениваются в поисковой выдаче.

система ранжирования Google -новые данные из первых рук
система ранжирования Google -новые данные из первых рук

На опубликованных показаниях инженера Google, представленных Министерством юстиции США, открывается возможность заглянуть в механизмы работы системы ранжирования. Они предоставляют понимание показателей качества, а также знакомят с таинственным сигналом популярности, основанным на данных браузера Chrome.

Документ содержит общий обзор факторов ранжирования важных для поискового продвижения, раскрывая основные принципы работы алгоритмов, но избегая деталей их внутренней структуры.

Сигналы ручной работы

Например, он начинается с раздела о «ручной обработке» сигналов, в котором описывается общий процесс сбора данных от оценщиков качества, кликов и так далее и применения математических и статистических формул для расчёта рейтинга на основе трёх видов сигналов. «Ручная обработка» означает масштабирование алгоритмов, которые настраиваются инженерами по поиску. Это не значит, что они вручную ранжируют сайты.

Сигналы ABC от Google

В документе Министерства юстиции перечислены три вида сигналов, которые называются сигналами ABC и соответствуют следующим критериям:

  • A — Якорные ссылки (страницы, ведущие на целевые страницы),
  • B — Тело (термины поискового запроса в документе),
  • C — клики (время, в течение которого пользователь находится на странице, прежде чем вернуться в поисковую выдачу)

Утверждение о сигналах ABC — это обобщение одной из частей процесса ранжирования. Ранжирование результатов поиска — гораздо более сложный процесс, в котором на каждом этапе ранжирования, начиная с индексирования, анализа ссылок, борьбы со спамом, персонализации, повторного ранжирования и других процессов, используются сотни, если не тысячи дополнительных алгоритмов. Например, Лиз Рид обсуждала основные системы тематизации как часть алгоритма ранжирования, а Мартин Сплитт — аннотации как часть понимания веб-страниц.

Вот что говорится в документе о сигналах ABC:

"Сигналы ABC — это ключевые компоненты релевантности (или базового показателя), с помощью которых Google определяет, насколько документ соответствует запросу.

T* (тематическая релевантность) эффективно объединяет (по крайней мере) эти три сигнала относительно простым способом. Google использует его для оценки релевантности документа на основе терминов запроса."

Документ даёт представление о сложности ранжирования веб-страниц:

«Разработка ранжирования (особенно актуальности) включает в себя решение множества сложных математических задач. Для определения актуальности может потребоваться команда инженеров, постоянно работающих над этими сложными задачами в рамках конкретного проекта.Причина, по которой подавляющее большинство сигналов создаются вручную, заключается в том, что если что-то сломается, Google будет знать, что нужно исправить. Google хочет, чтобы их сигналы были полностью прозрачными, чтобы они могли устранять неполадки и улучшать их.

В документе их подход, основанный на ручной обработке данных, сравнивается с автоматизированным подходом Microsoft. В нём говорится, что когда в Bing что-то ломается, устранить неполадки гораздо сложнее, чем при использовании подхода Google.

Взаимосвязь между качеством страницы и релевантностью

Интересным моментом, выявленным инженером по поиску, является то, что качество страницы не зависит от запроса. Если страница считается качественной и заслуживающей доверия, она будет считаться заслуживающей доверия по всем связанным запросам, что и подразумевается под словом «статический». Она не пересчитывается динамически для каждого запроса. Однако в запросе есть сигналы, связанные с релевантностью, которые можно использовать для расчёта итогового рейтинга, что показывает, какую решающую роль играет релевантность в определении рейтинга.

Вот что они сказали:

«Качество обычно стабильно при выполнении нескольких запросов и не связано с конкретным запросом. Однако в некоторых случаях сигнал «Качество» включает в себя информацию из запроса в дополнение к статическому сигналу. Например, на сайте может быть высококачественная, но общая информация, поэтому запрос, интерпретируемый как поиск очень узкой/технической информации, может быть использован для перехода на более специализированный сайт.Q* (качество страницы (то есть представление о надёжности)) невероятно важно. Если конкуренты видят логи, то у них есть представление об «авторитетности» конкретного сайта. Показатель качества очень важен даже сегодня. Качество страницы — это то, на что люди жалуются чаще всего…»

Воздушный шар студии Imagos
Воздушный шар студии Imagos

Качество страницы — как репутация в интернете: один раз заработал — пользуешься доверием везде. Но без релевантности даже самый авторитетный сайт рискует стать энциклопедией, которую никто не ищет.
Цитата с сайта веб-студии Imagos

ИИ вызывает недовольство пользователей Google

Инженер утверждает, что люди жалуются на качество, но также говорит, что ИИ усугубляет ситуацию, делая её ещё хуже.

Он говорит о качестве страницы:

«В наши дни люди всё ещё жалуются на качество, а ИИ ухудшает его.Это было и остаётся большой работой, но её можно легко воспроизвести, потому что Q в значительной степени статичен и в большей степени связан с сайтом, а не с запросом».

eDeepRank — способ понять рейтинг LLM

В Google перечислены другие сигналы ранжирования, в том числе eDeepRank — система на основе LLM, использующая BERT, языковую модель.

Он объясняет:

«eDeepRank — это система LLM, которая использует BERT и трансформеры. По сути, eDeepRank пытается взять сигналы на основе LLM и разложить их на компоненты, чтобы сделать их более прозрачными.

Та часть, где сигналы LLM разбиваются на компоненты, похоже, предназначена для того, чтобы сделать сигналы ранжирования на основе LLM более прозрачными, чтобы разработчики поисковых систем могли понять, почему LLM что-то ранжирует.

Рейтинг страницы, связанный с алгоритмами дистанционного ранжирования

PageRank — это оригинальная инновация Google в области ранжирования, которая с тех пор была обновлена. Я писал об этом алгоритме шесть лет назад. Алгоритмы определения расстояния по ссылкам вычисляют расстояние от авторитетных веб-сайтов по заданной теме (так называемых «стартовых сайтов») до других веб-сайтов по той же теме.

Эти алгоритмы начинаются с набора «стартовых» авторитетных сайтов по заданной теме, и сайты, которые находятся дальше от своего «стартового» сайта, считаются менее надёжными. Сайты, которые находятся ближе к «стартовым» сайтам, с большей вероятностью будут более авторитетными и надёжными.

Вот что Google сказал о PageRank:

«PageRank. Это единый сигнал, связанный с расстоянием до известного хорошего источника, и он используется в качестве входных данных для оценки качества».

Загадочный сигнал популярности на основе Chrome

Есть ещё один сигнал, название которого отредактировано, и он связан с популярностью.

Вот загадочное описание:

«[удалено] (популярный) сигнал, использующий данные Chrome».

Можно обоснованно утверждать, что это подтверждает, что утечка данных Chrome API связана с реальными факторами ранжирования. Однако многие SEO-специалисты, в том числе и я, считают, что эти API — это инструменты для разработчиков, которые Chrome использует для отображения показателей производительности, таких как Core Web Vitals, в интерфейсе Chrome Dev Tools.

Я подозреваю, что это отсылка к сигналу популярности, о котором мы, возможно, не знаем.

Инженер Google ссылается на другую утечку документов, в которых упоминаются «компоненты системы ранжирования Google», но у них недостаточно информации для обратного проектирования алгоритма.

Они объясняют:

«Произошла утечка документов Google, в которых упоминаются некоторые компоненты системы ранжирования Google, но в документах не говорится о конкретных кривых и пороговых значениях.Например,
сами по себе документы не дают достаточно информации, чтобы понять это, но данные, скорее всего, дают».

Выводы

В недавно опубликованном документе приводится краткое изложение показаний инженера Google, данных Министерству юстиции США, в которых в общих чертах описываются некоторые аспекты систем ранжирования Google. В нём обсуждается разработка сигналов вручную, роль статических показателей качества страниц и таинственный сигнал популярности, полученный на основе данных Chrome.

Это позволяет по-новому взглянуть на то, как создаются такие сигналы, как актуальность, надёжность, поведение пользователей при кликах и прозрачность на основе LLM, и по-другому оценить, как Google ранжирует сайты.

Для продуктивного продвижения и стабильно высокой эффективности сайта критически важно обеспечить безупречную техническую поддержку ресурса. Оптимизация скорости загрузки, регулярный аудит на наличие ошибок, исправление битых ссылок и корректная работа адаптивной верстки — это не просто «технические нюансы», а фундамент, на котором строится видимость сайта в поиске и лояльность пользователей.

Пренебрежение техническим состоянием ресурса — всё равно что гнаться за скоростью на машине с неисправным двигателем: рано или поздно это приведёт к потере позиций, трафика и доверия аудитории. Доверьте заботу о «здоровье» вашего сайта профессионалам — и он будет работать как швейцарские часы, принося вам прибыль, а не головную боль.

Google
89,1 тыс интересуются