Новый алгоритм ранжирования — Королёв. В чем суть? Отойдем в историю. Раньше поисковые системы показывали страницы, в которых контент содержал запрос, со временем поисковые алгоритмы оптимизировались и развивались. Далее слова и запросы поближе друг к другу. но поиск оставался только поиском по словам. Специалисты с развитием поисковых систем начали понимать и развивать новый вид поиска — семантический поиск. В прошлом году Яндекса запустил алгоритм Палех, первый шаг в сторону семантического поиска, сегодня новый алгоритм — Королев (В честь Сергея Павловича Королёва).
На чем основан алгоритм Королёв?
В основе нового алгоритма — искусственные нейронные сети, возникнув совсем недавно они активно развиваются.Если 1 нейрон — одна простая функция, то нейронная сеть — выполнение сложных и комплексных задачзадач. Огромным плюсом нейронных сетей — возможность самообучения. В алгоритме используется модель Deep structured semantic module. На входе — слова — на выходе на сколько пара текстов близка по смыслу. Яндекса научил свой алгоритм понимать о чем именно контент каждой странице с помощью нейросетей, а именно «скармливая» поисковой системе миллионы запросов, обработанных Ассесорами — пользователями яндекса, которые анализируют в ручном режиме соответствие запросу целевой странице. Упрощенно говоря — если по каком у то запросу пользователи кликают на какую то страницу — то запрос и страница связаны по смыслу. После тренировки модель приобретает способность представлять контент в виде особого набора чисел — так называемого «семантический вектора» — создавая тем самым последний скрытый слой модели (300 символов). Свойства — чем ближе запросы по смыслу — тем ближе тексты по смыслу
В поиске алгоритм семантического соответствия использовался давно, в Королеве — семантическое соответствие наиболее важный фактор. Теперь модель при оценке смысловой близости оценивает близость запроса телу страниц + анализ запросов, по которым раньше заходили в поиске, а не только заголовкам . В королеве радикально меняется количество страниц, для которых вычисляется смысловая близость — до 200 тысяч! (против 150 в Палехе).
С помощью чего и как развивается данный алгоритм Королёв?
Алгоритм развивается с помощью краудсорсингового сервиса Яндекс.Толока! Более миллиона толокеров работают и выполняют занятия на сервисе и развивают своими силами искусственный интеллект Яндекса. Все их задания анализируются и сводятся, для исключения влияния персонального и человеческого фактора, ведь если бы один человек решал о соответствии страницы запросу — такую систему вряд ли можно было бы назвать оптимальной.
Яндекс анонсирует свой поисковый алгоритм, как алгоритм, который умеет искать ответы не только по ключевым словам, но и по смыслу.
Что можно ожидать от алгоритма Королёв?
Можно ожидать, что после окончательного введения нового алгоритма, ранжирование сайтов будет осуществляться как в автоматическом, так и в полуавтоматическом режиме. Какой вывод можно сделать? необходимо работать над контентом. Максимально много и максимально грамотно.
А вы уже почувствовали влияние нового алгоритма?
Презентация: https://yandex.ru/blog/company/korolev
Источник: http://evorate.ru/blog/yandeks-korolev/