37 подписчиков

Внутренняя кухня Google Discover: исследование SDK раскрыло 9 этапов фильтрации вашего контента

26 марта26 мар

4 мин

Замечаете, что ваш контент то появляется, то исчезает в Google Discover без видимых причин? Новое исследование на уровне SDK, проведенное Метеханом Ешильюртом, впервые раскрывает механизмы этой системы. Мы проанализировали, как система оценивает, ранжирует и фильтрует материалы, и выяснили, почему одни статьи становятся популярными, а другие даже не показываются. Почему это важно. Google Discover может быть колоссальным источником трафика, но его непредсказуемость часто ставит маркетологов в тупик. Это исследование дает вам четкое понимание того, на каком этапе ваш контент может быть заблокирован и какие сигналы действительно влияют на его попадание в ленту. В ходе исследования была проанализирована телеметрия SDK и выявлена девятиэтапная схема обработки контента. Ваша статья проходит через: Discover работает иначе, чем многие думают. Если пользователь нажимает «Не показывать контент с этого сайта», статья не попадает в систему ранжирования. Блокировка происходит еще до анализа интерес

Оглавление

Как Discover отсеивает контент: от краулинга до показа
Главный фильтр: блокировка на уровне издателя
Что влияет на ранжирование: сигналы и модель pCTR

Почему это важно. Google Discover может быть колоссальным источником трафика, но его непредсказуемость часто ставит маркетологов в тупик. Это исследование дает вам четкое понимание того, на каком этапе ваш контент может быть заблокирован и какие сигналы действительно влияют на его попадание в ленту.

Как Discover отсеивает контент: от краулинга до показа

В ходе исследования была проанализирована телеметрия SDK и выявлена девятиэтапная схема обработки контента. Ваша статья проходит через:

Краулинг и анализ содержания.
Считывание ключевых мета-тегов (например, изображения и заголовка).
Классификацию типа контента (например, срочная новость или вечнозеленый материал).
Проверку на блокировку.
Сопоставление с интересами пользователя.
Применение серверной модели прогнозирования кликабельности (pCTR).
Формирование макета ленты.
Доставку контента.
Фиксацию обратной связи от пользователя.

Главный фильтр: блокировка на уровне издателя

Discover работает иначе, чем многие думают. Если пользователь нажимает «Не показывать контент с этого сайта», статья не попадает в систему ранжирования. Блокировка происходит еще до анализа интересов и оценки. Это решение окончательное, в отличие от механизма для повышения рейтинга всего домена.

Что влияет на ранжирование: сигналы и модель pCTR

После первичной оценки контента вступает в действие модель прогнозируемого CTR. Она работает на серверах Google и оценивает вероятность клика пользователя по вашей карточке. Хотя принцип работы модели остается скрытым, приложение ясно демонстрирует, какие сигналы отправляются в Google для ранжирования:

Заголовок страницы (из тега og:title).
Размер и качество изображения.
Свежесть контента.
История кликов и показов по данному URL.
Успешность загрузки изображений.

Обратите внимание на фактор свежести. Discover организует контент по временным отрезкам, и этот аспект имеет четкую градацию.

Контент возрастом от 1 до 7 дней получает самый сильный приоритет.
8–14 дней — умеренная видимость.
15–30 дней — ограниченная видимость.
30+ дней — постепенное снижение показов.

Есть особая классификация для сильного вечнозеленого контента. Однако по умолчанию новые материалы имеют преимущество.

Три кита технического попадания: изображения и мета-теги

Контент должен соответствовать строгим техническим требованиям, прежде чем попасть в Google Discover. Алгоритм считывает шесть ключевых тегов на странице, включая og:image и og:title, которые критически важны. Без изображения карточка не будет сформирована, и контент отсеивается на раннем этапе.

Качество изображения напрямую влияет на его отображение в ленте. Для крупных и заметных карточек изображения должны быть не менее 1200 пикселей в ширину. Маленькие картинки обычно отображаются в виде миниатюр и получают меньше кликов.

Важно помнить о системе резервного копирования: если тег og:title отсутствует, Discover пытается найти Twitter-тег или HTML-заголовок. Однако если на странице есть мета-теги nopagereadaloud и notranslate, это может полностью заблокировать её попадание в ленту Discover.

Эксперименты и персонализация: почему все видят разное

Понимание алгоритмов будет неполным без учета двух ключевых аспектов — экспериментов и персонализации. Эксперименты играют важную роль в оптимизации и улучшении алгоритмов. Исследование показало, что в одном сеансе может одновременно работать около 150 серверных экспериментов и более 50 контрольных функций, влияющих на отображение карточек. Это значит, что два пользователя с похожими интересами могут видеть совершенно разные ленты, потому что они оказались в разных экспериментальных группах.

Что касается персонализации, то здесь работают несколько источников данных:

Общие данные об интересах пользователя.
Сигналы от издателей, включая регистрацию в Publisher Center.
Индивидуальные действия: подписки, сохранения, скрытие материалов.
Сигналы вовлеченности, такие как время, проведенное за чтением.

Действует еще одно важное правило: если пользователь удалил вашу статью свайпом, система запоминает это навсегда для конкретного URL. Статья больше не появится в ленте этого человека.

Что делать прямо сейчас: 3 действия на основе исследования

Проведите аудит мета-тегов. Убедитесь, что на всех страницах, которые вы планируете продвигать в Discover, корректно прописаны og:image и og:title. Это минимальное требование для участия в отборе.
Анализируйте «мертвые» URL в обратном порядке. Если ваша качественная статья не взлетела в Discover, не спешите винить контент. Проверьте, не отсеялась ли она на этапе квалификации из-за технических проблем (например, слишком маленького изображения), а не на этапе ранжирования.
Перестаньте перепубликовывать отклоненный контент. Если пользователь убрал вашу статью свайпом из своей ленты, не пытайтесь подать ему тот же самый URL снова. Система запомнила это действие навсегда, и ваши усилия будут напрасны.

Заметки разработчика