Мы часто видим, как контекст определяет или меняет значение слова. Поисковые системы используют алгоритмы семантического поиска, которые повышают релевантность выдачи, даже если формулировка запроса не совсем соответствует запрашиваемому контенту. Сегодня мы рассмотрим и сравним эти алгоритмы у Google и Яндекс.
Что нужно знать о семантическом поиске, чтобы работать с ним?
Семантический поиск — это технология, при которой учитывается не каждое слово в запросе, а значение составленной из них фразы.
Например, если бы вы лет десять назад ввели в поисковую строку «фильм где сестры участвуют в программе по защите свидетелей», вы в лучшем случае увидели бы ссылки на форумы, где другие люди задавались тем же вопросом.
Сегодня результат будет таким:
В запросе нет ни слов из названия фильма, ни фамилии актрис, но при этом в двух поисковых системах нужная ссылка находится на первом месте в выдаче.
Именно так работает семантический поиск, использующий для формирования выдачи несколько факторов:
- информационный контекст;
- местонахождение пользователя;
- его персональные данные;
- поисковую историю;
- синонимы и словесные вариации;
- обобщенные и специализированные запросы;
- язык, которым был записан вопрос;
- предполагаемую цель поиска.
Все это позволяет уточнить информацию и искать ссылки, максимально соответствующие запросу пользователя вне зависимости от формулировки.
Для решения этой задачи Google использует собственную Сеть знаний, а также алгоритмы Колибри, RankBrain и BERT. Яндекс — алгоритмы Королёв, Спектр, YATI и Y1.
Семантический поиск в Google
Рассмотрим по порядку каждый инструмент, необходимый для работы со сложными запросами.
Сеть знаний (Граф знаний, Knowledge Graph)
Это обширная база данных, включающая в себя основную информацию о предметах, людях и явлениях, а также о существующих между ними связях. Используется с 2012 года. Основное назначение Сети знаний — ответить на запрос пользователя, не требуя от него перехода на сторонний сайт. Но, помимо этого, Граф знаний используется для улучшения качества поиска.
При обработке запроса система обращается к Knowledge Graph с двумя задачами:
- получить структурированные и упорядоченные данные;
- извлечь сущность из текста.
Алгоритм Колибри
Был запущен в 2013 году, чтобы повысить релевантность выдачи. Он анализирует содержимое страницы в целом, не останавливаясь на отдельных ключевых словах, встречающихся в тексте. Для создателей контента алгоритм стал первым шагом к созданию качественных материалов на заданную тематику вместо устаревшего и неинформативного SEO-копирайтинга.
В результате выдача Google стала более актуальной и уместной. Кроме того, алгоритм лучше подходил для голосового поиска.
Алгоритм RankBrain
Позволяет подбирать схожие понятия (или отсеивать неактуальные), опираясь на все поисковые запросы, обрабатываемые Google. Алгоритм представляет собой математическую модель со множеством векторов. Поисковой робот взаимодействует с этой моделью, когда встречает слово или фразу, с которыми не знаком. Rank Brain формирует гипотезы о том, какие известные роботу фразы могут иметь схожее значение. Другими словами, он ищет синонимы и связанные понятия.
После этого отслеживается поведенческий сценарий — таким образом алгоритм постоянно обучается, выявляя закономерности, которые чаще приводят к нужному результату. Благодаря этому поиск Google становится все более точным с каждым годом.
Алгоритм BERT
Это относительно новая разработка, впервые опробованная в 2019 году на английском языке, и постепенно внедряемая в другие языки. BERT — это аббревиатура от Bidirectional Encoder Representations from Transformers (двунаправленная нейронная сеть-кодировщик).
Алгоритм анализирует запрос целиком, не разделяя его на ключевые слова, и понимает естественную речь человека. Для этого система использует технологию обработки естественного языка (NLP) на основе нейронной сети. Это особенно важно для длинных и сложных по структуре запросов, где есть части предложения с разной иерархией и уровнями подчинения.
BERT обрабатывает слова в поисковой фразе на основе их отношения друг к другу, а не по отдельности, от первого до последнего. При этом контекст фразы анализируется двунаправленно, за счет чего и достигается высокая точность понимания речи человека.
Семантический поиск в Яндекс
У Яндекса есть свои способы повышения релевантности поиска, о них — ниже.
Технология Спектр
В случае с короткими запросами не всегда понятна цель, которую подразумевает пользователь. Например, вводя в поисковую строку слово «пицца», вы подразумеваете ее рецепт — или хотите заказать ее с доставкой на дом?
Именно для таких ситуаций Яндекс использует Спектр — систему, работающую со статистикой поисковых запросов. Анализируя эти данные, алгоритм выделяет отдельные термины, имена или названия продуктов, а затем распределяет их по категориям. Причем одно и то же слово может относиться сразу к нескольким категориям. Например, «Ява» - это остров в Индонезии, марка чая, язык программирования или даже мотоцикл.
Каждой категории присваивается свой список потребностей, с которыми люди обычно ищут то или иное слово, а также анализируется вероятность того, что они в своем запросе обращаются к той или иной категории. На основе этих данных и происходит ранжирование.
Иными словами, задача Спектра — определить пропорции, в которых ссылки, соответствующие запросу, но представляющие разные категории, должны присутствовать в итоговой выдаче.
На скриншоте выше хорошо видно, как формируется такая выдача. Красным отмечены ссылки на язык программирования, зеленым — на остров, синим — на мотоциклы.
В результате пользователь так или иначе найдет нужную ему информацию, даже если ввел многозначный запрос без определяющего его контекста.
Алгоритм Королев
Официально запущен в августе 2017 года. Алгоритм создан специально для работы с низкочастотными и многословными запросами (в том числе голосовыми, которые чаще представляют собой естественную речь).
Королев анализирует запрос (и контент на странице) целиком, извлекая общий смысл предложений, абзацев и текстов, чтобы затем сопоставить эти смыслы и найти наиболее схожие. Кроме того, в число факторов ранжирования входит реакция других пользователей со схожими по смыслу запросами.
Яндекс ввел также дополнительный индекс, расширяющий возможности поиска через добавление новых факторов оценки на этапе индексирования. При этом ранжирование проходит в несколько этапов — от простого к сложному, что позволяет сократить время обработки информации и «облегчает» техническую сторону процесса.
Как и Rank Brain, алгоритм является обучаемым — на выдачу влияет как поведение пользователей, так и многочисленные асессорские оценки.
Алгоритм YATI
Запущенный в 2020 году, алгоритм YATI (Yet Another Transformer with Improvements) помогает оценивать смысловую близость запроса пользователя и страницы сайта.
- Обновление существенно переработало сам принцип «понимания» смысла текста за счет принципиально новой архитектуры нейросетей-трансформеров.
- Теперь анализ производится для расширенной области данных — до десяти предложений в составе единого элемента.
- Добавлено несколько новых стримов, в том числе анкор-лист и запросный индекс для URL по кликам.
- Обучение нейросети ведется в том числе на основе оценок асессоров и толокеров.
- Система учится предсказывать вероятность клика, основываясь на базе Яндекса, включающей 1 млрд переформулировок.
Сразу после запуска YATI смог обеспечить более 50% вклада в ранжирование, тем самым перевесив вклад классической оптимизации текстов в продвижении сайтов.
Алгоритм Y1
И совсем свежее на момент публикации обновление было представлено Яндексом 10 июня 2021 года. Новая версия поиска экономит время пользователя, упрощая и ускоряя обработку информации. Среди ключевых особенностей Y1:
- Быстрые ответы даже для широких информационных запросов. Если на вопрос пользователя существует точный ответ, поисковик отразит его в блоке, помещенном прямо под поисковой строкой. При этом контент для быстрого ответа Яндекс берет на одном из релевантных для запроса сайтов. Вероятность попадания сайта в быстрые ответы выше, если вы предоставляете качественный контент, отвечая на вопрос точно, правдиво и без воды.
- Поиск внутри видеоинструкций. Теперь ответом на запрос пользователя может быть и видеофайл, причем запускаться он будет с момента, где речь идет именно о предмете запроса. А значит, сайтам стоит чаще работать с авторскими видеоматериалами. Если вы снимаете собственные ролики, старайтесь, чтобы они содержали четкие и понятные инструкции и не забывайте про соответствующую разметку.
- Оценка по отзывам. Теперь поисковая система предоставляет собственную сводную оценку заведений и организаций, опираясь на размещенные в сети отзывы. Причем ключевые параметры качества обслуживания оцениваются отдельно.
- Умная камера. Опция, определяющая предмет на фото, также может быть полезной в продвижении бизнеса: умная камера Яндекс может указывать на товары, если находит их в продаже, сразу предоставляя ссылку на интернет-магазин. Поэтому качественные фото товара становятся обязательным атрибутом онлайн-торговли.
Кто справился лучше?
Если сравнивать схожие между собой алгоритмы «Королев» и Rank Brain, можно заметить несколько общих черт:
- обучаемость;
- эффективность при работе с голосовым поиском;
- поиск значения фразы через синонимизацию;
Кроме того, исследование, проведенное «Пиксель Плюс» вскоре после запуска алгоритма от Яндекс, показало, что качество обработки информации в обеих поисковых системах сопоставимо, а ТОП выдачи по одинаковым запросам выглядит аналогично.
Поэтому мы можем предположить, что механизмы работы этих алгоритмов также похожи, а работа с многословными запросами в обеих поисковых системах будет одинаково комфортна и эффективна. Впрочем, не стоит забывать о том, что Google выпускает обновления чаще, чем Яндекс — а значит, у них больше шансов оперативно устранить ошибки обработки запроса.
Похожие сведения можно найти о другой паре алгоритмов: YATI и BERT. У первого, по наблюдениям экспертов, выше эффективность, зато второй способен решать более широкий круг задач, распознавание смысла текста — лишь одна из его возможностей.
Как быть с SEO в условиях семантического поиска?
Мы уже не в первый раз даем этот совет, но повторим его снова: работайте над качеством контента вместо того, чтобы пытаться «обойти» алгоритмы. Потому что любой алгоритм может меняться, но его итоговая цель всегда одна — предоставить пользователю то, что он ищет, в наиболее удобной и понятной форме.
Важное отличие продвижения в условиях семантического поиска — это то, что синонимичные поисковые запросы воспринимаются алгоритмами как одинаковые. Добавляя в свой текст, например, ключи «няня в Москве» и «бебиситтер в Москве», вы не сможете поднять рейтинг для текстов, объединенных общей тематикой. Поисковые алгоритмы поймут, что вы пишете об одном и том же.
Но в то же время уместное и корректное использование синонимов повышает качество вашего текста и снижает уровень заспамленности. А значит, их все равно стоит использовать, только теперь с другой целью.
Современные поисковые системы оценивают не слова и словосочетания, встречающиеся на страницах сайта, а глубину охвата темы и уровень представления материала. Большая, подробная и экспертная статья позволит вам продвигаться по самым разным ключевым запросам из затронутой тематики — даже в том случае, если напрямую они не упомянуты.
5 советов для работы с семантическим поиском
- Старайтесь подробнее раскрыть заданную тему, но избегать переспама и воды.
- Не забывайте про желания и намерения пользователя, который будет искать информацию по тому или иному запросу.
- Работайте с семантической разметкой HTML — она легко считывается поисковыми роботами, помогая им находить отдельные элементы (например, шапку и подвал сайта, блоки навигации, текст, видео).
- Не забывайте про микроразметку — она задает тип контента, содержащегося на странице, и упорядочивает ее структуру.
- Связь между несколькими документами можно установить при помощи ссылок — это увеличит релевантность каждого из них.
Итак, в условиях постоянно меняющихся алгоритмов Google и Яндекс главное для владельцев сайта — сохранять спокойствие и продолжать делать полезный контент для своей аудитории. По мере совершенствования семантического поиска находить полезные и релевантные статьи будет только проще.