В интернете оказались фрагменты исходного кода многих сервисов Яндекса — это называют самым масштабным сливом в истории компании.
Привет, это PR-CY! Мы создатели сервиса, который помогает улучшить сайт и выйти в топ. Он ищет проблемные URL, проверяет SEO сайта и следит за позициями.
Сегодня в слитой базе нашли факторы ранжирования поисковой системы, что еще интереснее. Особенно для сеошников, продвигающих сайты в Яндексе. 🤭
В публичный доступ попали 1922 фактора ранжирования, из них 244 отмечены как неиспользуемые (unused), а 988 как отмененные (deprecated). Остаются 690 потенциальных факторов ранжирования Яндекс.
Все факторы находятся в файле, содержащим описание по единой структуре: название, ссылка на внутренний ресурс (к нему доступ закрыт), AntiSeoUpperBound и описание. Хоть часть из них и ссылается на внутреннюю, недоступную нам документацию, все равно полезно изучить слив, чтобы лучше понимать ранжирование в Яндексе.
Что влияет на ранжирование сайта в Яндексе в 2023 году
Список большой, но вот часть из действующих факторов ранжирования:
- PageRank;
- возраст ссылок;
- трафик и процент органического трафика;
- возраст документа и его последнего обновления;
- надежность хоста (меньше ошибок 40x/50x — лучше);
- количество (/) в URL (много — плохо);
- цифры в URL (цифры — плохо);
- ключевые слова в URL (до трех слов);
- пессимизация (сильная сводит PageRank до нуля);
- средняя позиция домена по всем запросам;
- уровень вложенности URL;
- пользовательские факторы: CTR, last-click, добавление в закладки;
- обратные ссылки (с главных страниц важнее, чем с внутренних);
- баланс хороших и плохих ссылок;
- анкоры обратных ссылок;
- количество поисковых запросов;
- наличие трафика из Википедии;
- наличие карт js-api на странице (например, Google Maps);
- встроенное видео на странице (поврежденное — плохо);
- количество рекламы на странице;
- качество текста;
- и другие факторы.
А еще случайность попадания в топ, чтобы проверить поведение пользователей. Так что если вы обнаружили свой URL в топе, не спешите связывать это с вашими последними действиями, возможно, это эксперимент Яндекса. 🤷♂️
Больше пунктов с подробностями в материале Liftweb, а также на зарубежном сайте, где сделали поиск по всем факторам. Можно, например, посмотреть все, которые касаются ссылок.
Официальная позиция Яндекса: что компания говорит о сливе данных
Компания уверяла, что сами алгоритмы поиска остались нетронутыми, но сегодня выпустила официальный комментарий. Весь текст с извинениями и планами на будущее можно почитать по ссылке, а мы собрали самые интересные цитаты:
«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория <...>. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».
«Сложившаяся ситуация — повод провести масштабный аудит всего содержимого репозитория».
«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...>. Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».
«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».
«Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам. Считаем необходимым рассказать, почему такое происходило и что в связи с этим мы намерены предпринимать».
Как думаете, из-за чего мог произойти такой слив? Есть ли в списке факторов ранжирования те, которые вас удивили? Будем рады вашим комментариям!