Многие знают «режим чтения» в Chrome. Нажимаешь кнопку — и страница превращается в чистый текст с заголовком и парой картинок. За этим стоит алгоритм DomDistiller. Он решает, что важно для пользователя, а что можно убрать. По сути, браузер берёт DOM-структуру страницы, анализирует теги, плотность текста, повторяющиеся блоки, и оставляет «ядро»: заголовок, основной контент, изображения в теле статьи. Всё лишнее — меню, сайдбар, рекламные блоки — исчезает. Прямо Google не говорит, что DomDistiller используется в ранжировании. Но принцип похож на то, что делают поисковые роботы: -находят основной контент;
-игнорируют «шум»;
-структурируют данные по важности. И опять же, в утечке мы все видели много сигналов связанных именно с Chrome. Утечка внутренней презентации системы RealTime Boost от мая 2016 года также указывает на то, что данные Chrome будут использоваться в поиске. Ну, вы поняли. Если алгоритму сложно понять, где у вас текст, а где реклама, то и поисковик может растеряться. Стран