Замечаете, что ваш контент то появляется, то исчезает в Google Discover без видимых причин? Новое исследование на уровне SDK, проведенное Метеханом Ешильюртом, впервые раскрывает механизмы этой системы. Мы проанализировали, как система оценивает, ранжирует и фильтрует материалы, и выяснили, почему одни статьи становятся популярными, а другие даже не показываются.
Почему это важно. Google Discover может быть колоссальным источником трафика, но его непредсказуемость часто ставит маркетологов в тупик. Это исследование дает вам четкое понимание того, на каком этапе ваш контент может быть заблокирован и какие сигналы действительно влияют на его попадание в ленту.
Как Discover отсеивает контент: от краулинга до показа
В ходе исследования была проанализирована телеметрия SDK и выявлена девятиэтапная схема обработки контента. Ваша статья проходит через:
- Краулинг и анализ содержания.
- Считывание ключевых мета-тегов (например, изображения и заголовка).
- Классификацию типа контента (например, срочная новость или вечнозеленый материал).
- Проверку на блокировку.
- Сопоставление с интересами пользователя.
- Применение серверной модели прогнозирования кликабельности (pCTR).
- Формирование макета ленты.
- Доставку контента.
- Фиксацию обратной связи от пользователя.
Главный фильтр: блокировка на уровне издателя
Discover работает иначе, чем многие думают. Если пользователь нажимает «Не показывать контент с этого сайта», статья не попадает в систему ранжирования. Блокировка происходит еще до анализа интересов и оценки. Это решение окончательное, в отличие от механизма для повышения рейтинга всего домена.
Что влияет на ранжирование: сигналы и модель pCTR
После первичной оценки контента вступает в действие модель прогнозируемого CTR. Она работает на серверах Google и оценивает вероятность клика пользователя по вашей карточке. Хотя принцип работы модели остается скрытым, приложение ясно демонстрирует, какие сигналы отправляются в Google для ранжирования:
- Заголовок страницы (из тега og:title).
- Размер и качество изображения.
- Свежесть контента.
- История кликов и показов по данному URL.
- Успешность загрузки изображений.
Обратите внимание на фактор свежести. Discover организует контент по временным отрезкам, и этот аспект имеет четкую градацию.
- Контент возрастом от 1 до 7 дней получает самый сильный приоритет.
- 8–14 дней — умеренная видимость.
- 15–30 дней — ограниченная видимость.
- 30+ дней — постепенное снижение показов.
Есть особая классификация для сильного вечнозеленого контента. Однако по умолчанию новые материалы имеют преимущество.
Три кита технического попадания: изображения и мета-теги
Контент должен соответствовать строгим техническим требованиям, прежде чем попасть в Google Discover. Алгоритм считывает шесть ключевых тегов на странице, включая og:image и og:title, которые критически важны. Без изображения карточка не будет сформирована, и контент отсеивается на раннем этапе.
Качество изображения напрямую влияет на его отображение в ленте. Для крупных и заметных карточек изображения должны быть не менее 1200 пикселей в ширину. Маленькие картинки обычно отображаются в виде миниатюр и получают меньше кликов.
Важно помнить о системе резервного копирования: если тег og:title отсутствует, Discover пытается найти Twitter-тег или HTML-заголовок. Однако если на странице есть мета-теги nopagereadaloud и notranslate, это может полностью заблокировать её попадание в ленту Discover.
Эксперименты и персонализация: почему все видят разное
Понимание алгоритмов будет неполным без учета двух ключевых аспектов — экспериментов и персонализации. Эксперименты играют важную роль в оптимизации и улучшении алгоритмов. Исследование показало, что в одном сеансе может одновременно работать около 150 серверных экспериментов и более 50 контрольных функций, влияющих на отображение карточек. Это значит, что два пользователя с похожими интересами могут видеть совершенно разные ленты, потому что они оказались в разных экспериментальных группах.
Что касается персонализации, то здесь работают несколько источников данных:
- Общие данные об интересах пользователя.
- Сигналы от издателей, включая регистрацию в Publisher Center.
- Индивидуальные действия: подписки, сохранения, скрытие материалов.
- Сигналы вовлеченности, такие как время, проведенное за чтением.
Действует еще одно важное правило: если пользователь удалил вашу статью свайпом, система запоминает это навсегда для конкретного URL. Статья больше не появится в ленте этого человека.
Что делать прямо сейчас: 3 действия на основе исследования
- Проведите аудит мета-тегов. Убедитесь, что на всех страницах, которые вы планируете продвигать в Discover, корректно прописаны og:image и og:title. Это минимальное требование для участия в отборе.
- Анализируйте «мертвые» URL в обратном порядке. Если ваша качественная статья не взлетела в Discover, не спешите винить контент. Проверьте, не отсеялась ли она на этапе квалификации из-за технических проблем (например, слишком маленького изображения), а не на этапе ранжирования.
- Перестаньте перепубликовывать отклоненный контент. Если пользователь убрал вашу статью свайпом из своей ленты, не пытайтесь подать ему тот же самый URL снова. Система запомнила это действие навсегда, и ваши усилия будут напрасны.