Источник: rocky.by
Catboost – это новая технология машинного обучения, разработанная компанией Яндекс. Конечно, придумали её не просто так. Главная задача – помощь в ранжировании и формировании рекомендаций в поисковой выдаче. Простыми словами: это средство улучшения персонализированной поисковой выдачи, а явная цель технологии – задать уровень крутости чуточку выше, чем просто до небес.
Catboost построен на градиентном бустинге. Но куда делись знаменитые нейронные сети?
Бустинг – в переводе «наращивание», «усложнение». Для машинного обучения он играет важную роль. Известно, что искусственные нейронные сети – это слабые алгоритмы и достаточно примитивные методы. В том смысле, что данные они содержат недостаточно. Поэтому они вполне подходят для решения несложных задач, связанных с однородными данными: функция «похожие изображения» работает как раз-таки благодаря им.
А если постоянно дополнять алгоритмы новыми данными? Тогда и произойдёт «наращивание» – бустинг. Градиентный бустинг нужен машинному обучению, чтобы решать задачи повышенной сложности.
Когда интернет только появился, в ранжировании не было необходимости: сайтов было мало, конкуренции, соответственно, тоже. Но потом сайтов стало больше, и ссылочная масса стала иметь значение.
Простые алгоритмы перестали справляться с большим количеством сайтов и с таким же большим количеством веб-мастеров, которые хотели играть быстрым, но нечестным путём.
Почему вообще машинное обучение важно для поисковиков? Очень простой ответ: введите запрос и продвиньтесь дальше ТОП 10 страниц. Чем дальше – тем меньше результат релевантен запросу. О последних страницах выдачи даже говорить не приходится. Прибавить к этому нежелание пользователей долго искать нужную информацию, и получаем: поисковик за считанные секунды должен проанализировать всю существующую информацию и показать пользователю релевантную выдачу.
Говорить о технологиях машинного обучения можно долго, но нас интересует другой вопрос…
Как Catboost повлияет на SEO?
Во-первых, манипулировать результатами выдачи (читайте, продвигать сайт) станет гораздо сложнее. Catboost помогает персонализировать выдачу под каждого конкретного пользователя, а любая персонализация для веб-мастера – головная боль.
Во-вторых, изменится принцип ранжирования. К котикам название Catboost не имеет никакого отношения и расшифровывается как категориальный бустинг. Он обрабатывает разнородные данные, и делает это гораздо быстрее своего предшественника – Матрикснета.
Яндекс выложил Catboost в открытый доступ, и каждый может проверить действие «Котенка» на себе.