Мартин Сплитт, сотрудник Google, который часто отвечает на вопросы пользователей в Twitter и специальных видео, рассказал о том, как работает машинное обучение в различных системах Google. На данный момент оно активно применяется в сканировании, однако ещё не задействовано в рендеринге. Об этой возможности специалисты пока только задумываются.
Благодаря нейросетям, Google легко распознаёт ряд параметров при сканировании, предоставляя пользователям актуальную выборку. Так, он способен определять качество URL, а также особенности контента по ссылке - как его качество относительно стандартов системы, так и свежесть относительно остальных сайтов. Таким образом, по словам Сплитта, это позволяет многократно повысить точность поисковой выборки.
Поскольку сайтов в интернете бесчисленное множество, Google, даже со всеми имеющимися мощностями, не имеет возможностей просканировать их все. В таких случаях машинное обучение помогает сэкономить ресурсы и понять, стоит ли данный конкретный URL самого сканирования. В результате выборка получает только актуальные и качественные ссылки, среди которых есть и заработок на рефералах.
Также машинное обучение позволяет понять, стоит ли уделять время на ежедневное сканирование сайта или можно обойтись менее частыми визитами. Такое решение система принимает, основываясь на частоте обновления контента - для ежедневных новостей в таком случае выделяется больше ресурсов, чем для менее периодических изданий.
Впрочем, даже Спилтт не способен точно сказать, насколько технология приживётся в Google. Сейчас неизвестно, эксперимент это или уже устоявшаяся технология, так что в будущем станет понятно.
Источник: https://livesurf.ru/blog/6999-google-vnedrit-v-skanirovanie-mashinnoe-obuchenie.html