Чтобы достичь максимальной справедливости в алгоритмическом распределении показов, надо определиться с основными критериями, которые говорят о качестве и востребованности контента.
Начало:
В настоящее время (судя по всему) ведущими коэффициентом в распределение показов является соотношение кликабельности (CTR) карточки с процентом дочитывания (просмотра у видео), что не совсем верно.
Даже в идеальных условиях, когда определение кликбейта работает по всем каналам (в том числе и СМИ), короткие форматы, и укороченные длинные, получают явное преимущество.
Статья в два абзаца, всегда будет иметь лучший процент дочитывания, чем самый гениальный лонгрид. Поэтому при равном CTR получит значительно больше показов. Что уже говорить о постах в пару строчек или роликах на несколько секунд.
Другой явный маркер "лайк", который в Дзене имеет двойственное значение:
- В Ленте — "показывать еще такое".
- На материале — "мне понравилось",
засчитывается не очень понятным образом. То ли учитывается первый вариант, то ли второй. Но точно не оба.
Мне кажется, что все-таки первый. Причем только из общей Ленты, так как классные ребята очень боятся ботоводов.
Наконец третий — процент подписавшихся.
Соотношение количества пользователей ознакомившихся с материалом с числом на него подписавшихся, имеет самое сильное влияние на количество показов. Работает это также, как раньше работал CTR.
Краник полностью открывается для публикаций показывающих максимально лучший результат, и постепенно закрывается при его падении.
Будет ли это работать при новой форме оплаты, пока не понятно. Но мне кажется, что смысла его убирать нет.
Есть еще один хитрый коэффициент — внешние заходы. Точнее их соотношение к внутреннему трафику. В прежнем Дзене, он играл положительную роль, в Дзене Низамова - отрицательную. (Я перестала из-за этого даже делать репосты в своих жирных группах.)
Низамовцы считают, что если автор может привлекать трафик со стороны, то пусть на этом и строит работу. Не фиг его закармливать показами.
Вообще характеристик по которым работает алгоритм выдачи десятки. В Поиске Яндекса их более 500. Но они далеко не равнозначны по влиянию.
На что бы ориентировалась я?
Повторюсь в который раз — главное в Дзене справедливая, равная для всех, модерация и отсутствие привилегий для отдельных авторов. Без этого невозможно выстроить работу алгоритма, так как отдельные каналы будут получать искусственно завышенные коэффициенты.
CTR
CTR важный параметр от которого не уйти коммерческому проекту — чем чаще пользователь кликает по карточке, тем больше рекламы он просмотрит.
Однако, если материал ему не нравится или вызывает негативные эмоции, то кликабельность самих рекламных блоков стремится к нулю — показы пропадают впустую.
Поэтому CTR должен быть связан с временем нахождения на материале и количеством дизлайков.
Высокий CTR с малым временем нахождении на материале или сильной негативной реакцией, не должен влиять на показы.
Все эти параметры должны сниматься за произвольно выбранную единицу времени, а не в абсолютных значениях, чтобы исключить влияние ботоводов.
Таким образом, вся дешевая кликбейтно-желто-новостная муть, а также укороченные материалы, лишаться своих технических преимуществ. Первые, потому-что их всегда активно дизлайкают, вторые, по времени.
Лайки
Дзен всегда отрицал влияние лайков на алгоритм, так как опасался использования соответствующих программ или заказов на действия человеко-ботов.
Однако это один из самых явных показателей, что материал нравится пользователю. Просто его надо правильно использовать.
Здесь, я думаю, надо учитывать лайки от пользователей подписанных на канал. Их соотношение к числу подписчиков просмотревших материал.
Опять же, статистика должна сниматься за какой-то определенный промежуток времени, который может еще и плавать, чтобы усилия ботоводов пропадали впустую.
Я вижу это приблизительно так. Например, с 5-ой по 10-ую минуту начала показов снимается статистика по лайкам подписчиками. В зависимости от того, насколько она отличается от средних значений по платформе, открывается краник показов для всех пользователей. Через некоторое время новый замер, уже с учетом лайков не подписчиками. И соответствующее решение.
Подписчики
Показ любых материалов должен начинаться с подписки, с активной открутки именно им. С них же должны сниматься первые параметры для алгоритма показов.
Так как все они относительные, то все авторы, вне зависимости от количества подписчиков, будут в равных условиях.
Раздутая подписка пустозвонов, новостников и желтушников будет играть против них. Преимущество получат те каналы, которые наиболее удовлетворяют запросы своей подписки, кого выбрали именно для того, чтобы читать/смотреть, а не про запас.Типа, может пригодиться, когда нечего будет делать.
В дальнейшем конечно это преимущество будет нивелировано, но хотя бы так ламповые каналы получат хоть что-то.
(Продолжение следует)