Найти тему
evgeny tarasov

Почему Гугл убрал Page Rank и почему нельзя доверять DA/PA TF/CF

Собственно, Гугл и сам сказал почему он это сделал: «PR перестал отражать реальное положение дел». Это правда, но не вся. Дело в том, что PR имеет связь с качеством страницы не всесторонне и является только метрикой ее ссылочной и трафиковой популярности. Конечно, формула Page Rank менялась и Гугл старался учитывать не только количество, но и качество ссылок, опираясь на те же признаки качества страниц, с которых эти ссылки стояли. Но в метрике оценки качества страницы и ссылок с них никогда не участвовал анализ семантики этих страниц. Эта неполнота вскоре начала приносить вред всей поисковой системе, потому что оптимизаторы ориентировались на PR при покупке ссылок, считая, что чем выше PR, тем лучше ссылка и дороже стоит, соответственно. Т.е. оптимизаторы не воспринимали и до сих пор не воспринимают релевантность документа анкору, как основной признак качества ссылки. Для них до сих пор это имеет второстепенное значение. Конечно, каждый оптимизатор стремиться по возможности покупать релевантную ссылку, но машинный взгляд на этот вопрос сильно отличается от взгляда вебмастера.

Чтобы понять о чем идет речь и какая разница между этими оценками, рекомендую взять ключевое слово вашего анкора и для испытуемой страницы поиском по сайту определить позицию этой страницы в выдаче. Если эта страница окажется в этой выдаче в ТОП1, то можно говорить о том, что эта страница по вашему анкору действительно релевантна. Но вот если она будет находиться далеко, это будет означать низкую релевантность страницы вашему анкору. Это будет означать, что ссылка по вашему анкору с такой страницы не является релевантной ссылкой и скорее всего, будет классифицирована Гуглом как спамная ссылка.

При оценке качества ссылок Гугл смотрит не на абсолютное значение релевантности анкора странице, а на относительную в рамках всего сайта. Это нужно понимать и знать. Но на глаз вы это ни за что не определите. Вы же не можете как машина оценить все страницы сайта одновременно! В итоге, вам будет казаться, что вы покупаете с этой страницы хорошую ссылку, а если еще у страницы будет и высокий PR, то вы точно оцените такую ссылку как очень хорошую. Но на самом деле, она вполне может оказаться для Гугла спамной!
Понимая, что это является негативным фактором для всей поисковой системы, поскольку нерелевантные ссылки портят экосистему из ссылок, соединяющих сайты, Гугл принял решение избавить вас от возможности ориентироваться при покупке ссылок на PR.
Но индустрия SEO решила воссоздать свой «PR» и появились параметры DA/PA, TF/CF


Разумеется, эти подделки обладают худшим качеством, чем родной PR, кроме того, к качеству ссылки они имеют еще меньшее отношение. Т.е. использовать этот параметр для подбора доноров можно, но лишь как предварительный фильтр, чтобы потом уже выбирать для каждого донора правильный релевантный анкор. И только тогда можно будет говорить о полезности выбранных вами ссылок.
Акцентирую ваше внимание на то, что вес ссылки в понимании Гугла, Яндекса, Бинга и пр. поисковиков, это именно количество приносимой ей пользы для того, кто по ней переходит. Именно эта качественная величина измеряется внутри гугла для каждой ссылки. Именно это и влияет на позиции продвигаемого сайта, причем не только по анкору ссылки, но и по целой группе связанных с ним ключевых слов. Связанные ключевые слова, это те ключевые слова, которые употребляются с исходным наиболее часто в общей коллекции документов в интернете статистически.


Для разных поисковых систем число связанных с анкором ключевых слов разное. Для Яндекса например этот показатель выше чем в Гугле в 3 раза по коммерческим запросам из за более детерминированного коммерческого семантического графа. Число связанных запросов для среднечастотных коммерческих ключевых слов около 6-7 в Гугле. Это число очень медленно растет с увеличением частотности запроса. Функция не является линейной. Поэтому высокочастотные анкоры, связывающее собой большее количество ключевых слов, тянут за собой большее количество релевантных ключевых слов. Т.е. дорогие ссылки выгодно покупать именно с высокочастотными анкорами, чтобы они продвигали сайт по целой пачке ключевых фраз из 15-20 штук. Впрочем, опытные оптимизаторы и так знают об этой тонкости.
Возвращаясь к весу ссылок (т.е. именно то интегрированное числовое значение полезности, которое определяет силу влияния ссылки на позиции продвигаемого сайта), хочется сказать, что метрики качества полезности ссылок одинаковы для всех популярных мировых поисковых систем и отличаются лишь качеством их сбора. Улучшаются с эволюцией только полнота и точность этих метрик, но сами они не меняются и не будут меняться никогда, потому что эти метрики имеют фундаментальный характер, скопированный изначально из социологии реального мира offline .

Рассмотрим их подробнее:
О полезности ссылки с некоторого документа для того, кто по ней потенциально будет переходить можно судить в первую очередь по ctr этой ссылки. Понятно что релевантный анкор будет иметь больший ctr. На него также влияет и месторасположенние ссылки на странице. Т.е. кликабельность показывает интерес посетителя к анкору ссылки и он имеет некоторую потенциальную надежду на то, что перейдя по ссылке получит искомую информацию, которая его удовлетворит. Т.е. ссылка полезна для него пока потенциально и нельзя по этой метрике сразу судить о качестве ссылки. Поэтому второй метрикой качества ссылки является информация о том, удовлетворен ли окажется пользователь, перешедший по этой ссылке. Если к примеру, по анкору «пила двуручная» на строительном портале вы попали на сайт по стрижке собак, то понятно что пользователь пожалеет о том что кликнул по ссылке. Поэтому Гугл и остальные поисковики оценивают релевантность по анкору и страницу акцептора, т.е. куда переходит пользователь.


Однако, если на странице акцептора будет та же информация или она мало чем будет отличаться от страницы донора, то никакой пользы человек опять не получит. Страница акцептора может даже быть намного более релевантна анкору чем страница донора, но при переходе на эту страницу пользователь не решит своих проблем. Поэтому поисковые алгоритмы оценивают не только разницу релевантностей страницы донора и акцептора по анкору, но и пытаются понять в чем именно она заключается. И вот здесь качество метрики полезности ссылки упирается в эволюцию понимания гуглом уже смысла, изложенного в обоих документах. Если кто то продолжает до сих пор думать что Гугл не в состоянии понимать смысла написанного, то не буду доказывать вам это. Просто скажу что вы ошибаетесь. Может в другой раз я раскрою эту тему для вас более подробно и мы поговорим о семантических графах и автоматических переводах, которые эту тему смысла эксплуатируют, а не занимаются тупым подставлением значений слов по словарям.
Короче говоря, определение веса ссылок в своем численном значении сильно зависит от качества распознавания смысла написанного в обоих документах связанных ссылкой, определении ctr анкора. А еще важной метрикой является трафик на странице донора, поскольку скольбы полезной не была на нем ссылка и куда бы она не вела, если на странице никого нет, то пользы от ссылки не больше чем от гениальной идеи в тумбочке стартапера.

Здесь следует отметить, что поисковые системы не измеряют трафик на страницах сайта, а прогнозируют его исходя из позиций каждой страницы по поисковым запросам. Данные со счетчиков гугла, если даже они стоят на сайте, не используются для ссылочного ранжирования этого сайта. Эти данные образуют общую статистику для обучающей выборки машинного обучения. Они лишь корректируют трафиковые прогнозы на страницах которые на них похожи.
Конечно, определение Гуглом численного значения ссылочного веса довольно сложная и погрешность довольно велика, но, как вы понимаете, DA/PA и TF/CF не имеют к весу ссылки почти никакого отношения.