Найти в Дзене
Блокнот Фрилансера

Рекомендации в Дзене. Принцип работы алгоритмов

Оглавление

Андрей Зимовнов, руководитель службы рекомендаций в Дзене дал подробный ответ о том, как работают рекомендательные системы платформы и что нужно учитывать авторам при создании контента. Ниже расскажу о главных моментах, с учетом собственного опыта и краткого анализа.

Как работают алгоритмы рекомендаций в Дзене

Роботы площадки работают в двух режимах:
1. Exploration – вновь пришедшие (новые) пользователи
2. Exploitation – пользователи с имеющейся историей пребывания на Дзене

В первом случае система рекомендаций рандомно выбирает 1 миллион(!) материалов, из них отбирает 1000 публикаций различной направленности и формата, из которых выкатывает 20 наиболее популярных карточек одного формата (статья/видео/ролик). Все 20 материалов созданы на различные темы.

Анализ поведенческих факторов дает представление алгоритмам системы о том, какой контент транслировать дальше, а какой убрать из ленты пользователя.

принцип работы алгоритмов
принцип работы алгоритмов

Во втором случае, пользователю подбираются публикации на основании продемонстрированных ранее интересов.

Чтобы процесс рекомендаций был более или менее прозрачным, в карточке рекомендованной публикации вы можете увидеть подсказку, почему вам показывают именно этот материал. Правда видно её (подсказку) пока только после того, как вы кликните на троеточие в правом углу карточки публикаций и нажмете на вопрос «почему я вижу эту статью».

Тогда Дзен прокомментирует что-то вроде этого:

-2

Анализ поведенческих факторов. На что обращают внимание роботы

Все, абсолютно все действия пользователя, будь то нового или «с историей» анализируются моментально и, согласно полученным сигналам, идет распределение интересов.

На результат выдачи влияет позитивное взаимодействие. В речи Зимоновнова были отмечены следующие моменты:

1. Прочтение статьи продолжительностью от одной минуты

2. Степень вовлеченности в просмотр видео

3. Включение звука при просмотре видео

4. Зависание/не зависание при просмотре роликов.

Важно: каждый вид контента анализируется отдельно (статьи, видео, ролики имеют свою историю запросов и позитивных сигналов).

Есть еще одно уточнение. Если в определенный момент времени вам было интересно (условно) прочитать про поездку в Грузию, т.к. вы собирались ехать на отдых именно в эту страну, то это не значит, что ваша лента рекомендаций будет завалена информацией про Грузию.

Здесь есть свой принцип подбора информации. Никогда система не выдает подряд три карточки с одного канала или на одну и ту же тему. Она выдаст вам нечто похожее. Как вариант, к Грузии добавят Абхазию, подкинут статью про особенности кавказкой кухни или еще что-то, что имеет дополнительные точки касания с просмотренным вами ранее материалом.

Иногда случается такое, что алгоритмы Дзена не могут определить связанность между, казалось бы, похожими на первый взгляд материалами, тогда на помощь приходят Толокеры.

Предположим, что в Грузию вы уже съездили и потеряли интерес к этому направлению, а алгоритм всё еще подсовывает вам материал на эту тему. Ваши «отскоки» (зашел и сразу и вышел) пролистывание материала, дают новые сигналы алгоритмам. Негативные. В рейтинге показов эта тема будет снижаться и вскоре может вовсе пропасть из вашей ленты.

Обновление всей матрицы запросов происходит 1 раз в две недели и если вы никак не реагировали на какое-то из направлений, то через 14 дней оно исчезнет из поля вашего зрения.

А вот вектора документов обновляются каждые 30 минут. Если ваш материал написан по всем правилам СЕО, алгоритмы легко считывают его тему, направленность и понимают какому кругу людей он будет адресован, то уже в первый час с момента выхода он может получить хорошее число рекомендаций.

Что влияет на количество рекомендаций

Как уже было сказано выше, попадание в ленту рекомендаций осуществляется на основе позитивных сигналов. К ним относятся:

- время просмотра

- уровень вовлеченности

- популярность разбираемой темы

- условный CTR

- лайки

- комментарии

- конверсия внутри темы

Ну и, пожалуй, самый весомый отклик – подписан/не подписан на канал автора. Если потребитель контента не является подписчиком, при этом читает/просматривает весь материал, демонстрируя высокий уровень вовлеченности, вес сигнала существенно выше. Всем ведь понятно, что иногда пользователи просматривают материал из солидарности с автором, на которого давно подписаны. И алгоритмы тоже понимают этот момент.

План реконструкции рекомендательных систем

Сейчас команда Зимовнова работает над тем, чтобы внедрить функцию «убрать тему из зоны видимости».

На данный момент весь контент в Дзене разбит на 40 тем. Один и тот же пользователь в разный момент времени имеет разные увлечения и интересы. Но есть темы, которые он ни за что не хотел бы видеть в своей ленте, но по какой-то причине алгоритм нашел связь между просмотренным ранее контентом и новой (нежелательной для пользователя) темой. Тогда кнопка «убрать тему» была бы полезна.

Еще один важный момент по рекомендательным системам

Я всегда говорила о том, что сохранение публикации в закладки дает ей определенный вес в глазах алгоритмов. Но бывают ситуации, когда человек увидел в ленте материал, показавшийся ему интересным, при этом не имеет времени на его прочтение. Он откладывает его в закладки (без предварительного просмотра) и больше никогда не возвращается к нему (забыл, потерял интерес/актуальность). Это негативный сигнал для роботов Дзена. Исправить ситуацию можно следующим образом: открыть материал, поставить лайк и сохранить в закладки.

Другой случай, когда человек полностью просмотрел публикацию и только потом нажал кнопочку «сохранить». Вот тут идет демонстрация того, что контент действительно полезный, важный, нужный.

Как видите, ничего нового в работе рекомендательных систем нет. Они не особо отличаются от систем того же Яндекса или Гугла. В приоритете остается неподдельный интерес пользователя. И вот тут набившая оскомина рекомендация «пищите больше, пишите лучше» начинает играть новыми красками.

Если остались вопросы, задавайте их в комментариях, постараюсь ответить на все. И помните, что лучшая награда для автора – это ваша поддержка в виде лайка.