Найти тему

⚡ В слитом коде Яндекса оказались факторы ранжирования

В интернете оказались фрагменты исходного кода многих сервисов Яндекса — это называют самым масштабным сливом в истории компании.

Привет, это PR-CY! Мы создатели сервиса, который помогает улучшить сайт и выйти в топ. Он ищет проблемные URL, проверяет SEO сайта и следит за позициями.

Сегодня в слитой базе нашли факторы ранжирования поисковой системы, что еще интереснее. Особенно для сеошников, продвигающих сайты в Яндексе. 🤭

В публичный доступ попали 1922 фактора ранжирования, из них 244 отмечены как неиспользуемые (unused), а 988 как отмененные (deprecated). Остаются 690 потенциальных факторов ранжирования Яндекс.

Все факторы находятся в файле, содержащим описание по единой структуре: название, ссылка на внутренний ресурс (к нему доступ закрыт), AntiSeoUpperBound и описание. Хоть часть из них и ссылается на внутреннюю, недоступную нам документацию, все равно полезно изучить слив, чтобы лучше понимать ранжирование в Яндексе.

Что влияет на ранжирование сайта в Яндексе в 2023 году

Список большой, но вот часть из действующих факторов ранжирования:

  • PageRank;
  • возраст ссылок;
  • трафик и процент органического трафика;
  • возраст документа и его последнего обновления;
  • надежность хоста (меньше ошибок 40x/50x — лучше);
  • количество (/) в URL (много — плохо);
  • цифры в URL (цифры — плохо);
  • ключевые слова в URL (до трех слов);
  • пессимизация (сильная сводит PageRank до нуля);
  • средняя позиция домена по всем запросам;
  • уровень вложенности URL;
  • пользовательские факторы: CTR, last-click, добавление в закладки;
  • обратные ссылки (с главных страниц важнее, чем с внутренних);
  • баланс хороших и плохих ссылок;
  • анкоры обратных ссылок;
  • количество поисковых запросов;
  • наличие трафика из Википедии;
  • наличие карт js-api на странице (например, Google Maps);
  • встроенное видео на странице (поврежденное — плохо);
  • количество рекламы на странице;
  • качество текста;
  • и другие факторы.

А еще случайность попадания в топ, чтобы проверить поведение пользователей. Так что если вы обнаружили свой URL в топе, не спешите связывать это с вашими последними действиями, возможно, это эксперимент Яндекса. 🤷‍♂️

Больше пунктов с подробностями в материале Liftweb, а также на зарубежном сайте, где сделали поиск по всем факторам. Можно, например, посмотреть все, которые касаются ссылок.

Официальная позиция Яндекса: что компания говорит о сливе данных

Компания уверяла, что сами алгоритмы поиска остались нетронутыми, но сегодня выпустила официальный комментарий. Весь текст с извинениями и планами на будущее можно почитать по ссылке, а мы собрали самые интересные цитаты:

«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория <...>. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».
«Сложившаяся ситуация — повод провести масштабный аудит всего содержимого репозитория».
«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...>. Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».
«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».
«Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам. Считаем необходимым рассказать, почему такое происходило и что в связи с этим мы намерены предпринимать».

Как думаете, из-за чего мог произойти такой слив? Есть ли в списке факторов ранжирования те, которые вас удивили? Будем рады вашим комментариям!