6754 подписчика

Как сделать так, чтобы в Ленту попадали лучшие статьи (мой вариант механизма определения качества)

25 декабря 201925 дек 2019

334

4 мин

Оглавление

Дерево Фобоначчи
Стандартные варианты оценки качества
Мое предложение

Я много раз предлагал в формировании выдачи, вместо толокеров и "группы качества Дзена", использовать авторское сообщество. Чтобы оно определяло, кому стоит налить показов, а кому нет.

Судя по комментариям, и обсуждению предыдущих статей, посвященных этому вопросу, большая часть сообщества выступает против участия в процессе авторов. (Меньшая "за", тайно надеясь, что им будет поручена ведущая роль.)

Вот и на этот раз, буквально вчера, тема опять возникла. Инициатором выступила Уважаемая (снял шляпу, поклонился шаркая ножкой) Наталья (сделал три земных поклона) ака Еремина (пал ниц):

И еще:

Даже Бизнес, у которого с Натальей продолжительные виртуальная "любовь", косвенно ее поддержал.

Поддерживает Наталью и другой авторитетный "старик" из местных, Nil Ponomarev:

Прочитав эти комментарии, я понял две вещи:

Что хотя я топлю за участие авторов, но у меня самого нет законченной оформленной идеи их использования.
Что критики авторского участия совершенно правы, заменять наемных работников на авторов это обмен шила на мыло.

Но я то себе все это по другому представлял. В моем неоформленном варианте должен был быть изменен сам механизм выявления качества.

Дерево Фобоначчи

(не пугайтесь, это просто прикольное название, о Фибоначчи и его числах не будет ни слова)

Я уже много раз писал, что считаю главной проблемой дезноводов — их разочарование в собственных силах.

Когда они начинали проект, то свято верили, что способны создать что-то принципиально новое. Но, то ли "шапка оказалась не по Сеньке", то ли ведущий состав был подобран неверно (иногда 1-2 лишних человека способны убить любую мыслительную активность), но очень скоро руководство свернуло на проторенную дорожку дублирования сторонних наработок.

При этом, используя чужое, они даже не пытаются его доработать с учетом особенностей Яндекс.Дзен. Так дело обстояло и с механизмом выдачи статей в Ленту — поначалу дзеноводы пытались делать что-то свое, а потом стали тупо копировать элементы других платформ.

А ведь у Дзена есть один недостаток, который позволяет совершенно по другому, на принципиального новом уровне, оценивать качество статей и выдавать их в Ленту. Речь о ограниченности жизни статьи.

Стандартные варианты оценки качества

По сути, если не брать комплексных форм, у Дзена есть три варианта оценки качества:

Алгоритмический.
Не позволяющий писать красиво и эмоционально. Сложные деепричастные обороты, иносказательность, сатира, использование омонимов, эзопов язык, фразеологизмы и прочее, алгоритмом понимается плохо.
Наемными работниками.
Эти, не позволяют писать на профессиональные или специфические темы. А так как люди в основном там достаточно примитивные, то круг понимаемых ими тем ограничивается шоу-бизом, фикс-прайсом и бытовухой.
Авторами.
Эта область нами недостаточно исследована, но как справедливо предполагают многие комментаторы, авторы, в первую очередь, будут топить конкурентов.

Мое предложение

Действительно, если из избранных авторов создать некий "ареопаг мудрецов", то это рано или поздно приведет к махинациям и преобладанию личного над общественным. Но я и не собирался такого предлагать.

Мой вариант заключался в использовании всего авторского сообщества — каждый автор бы принимал участие в проверке текстов, а алгоритм суммировал результат, вводя и свой оценочный коэффициент.

Как это сделать? — Да очень просто. Достаточно учесть, что Дзену нужно выявить не абсолютно качественную статью, как например в Поиске, а лучшую из публикующихся (или опубликованных) за последнее время.

Чтобы система работала надо сделать несколько вещей:

Принудительно заставить авторов оценивать контент.
Например, чтобы опубликовать статью, ему надо будет проверить 10 статей других авторов.
Эти статьи должны быть одной тематики (из одной тематической Ленты).
Оценивать надо не по абсолютным показателям, а по относительным. Т.е. распределив статьи с первого по десятое место (1 место - 10 баллов, 10-е - 1).
Таким образом каждая новая статья будет иметь 10 оценок от 10 независимых авторов. Даже если кому-то попадется его тематика, утопить конкурента он не сможет (там будут все конкуренты, а ставить кому-то 10-ку, ему все равно надо будет).
Упростить и конкретизировать требования к контенту, и отдать вопрос пессимизации на волю алгоритму.
Алгоритм также занимается сортировкой статей перед отправлением на проверку авторам, обрабатывает данные проверки, и вводит свой оценочный коэффициент по результатам статистики от первой открутки в Ленте.

В реальности это должно выглядеть приблизительно так: десяти авторам поступает на проверку список из статей с кликабельными ссылками и местом для отметки. Авторы просматривают статьи (алгоритм это фикисирует при обработке результатов) и выставляют балы. Статья набравшая наивысший бал получает максимально возможный порог охватов, те кто в конце списка наименьшие.

Затем, после первой волны, когда алго получит статистику, он подключает свои коэффициенты. Возможно, с учетом их, третья статья получит показов больше, чем первая. Но статьи из нижней части не могут стать самыми показываемыми (по сути, это вопрос предустановок — насколько коэффициент алгоритма сделан значимым),

По-моему такой подход наиболее справедлив.

Да, это потребует определенных трудозатрат и времени от авторов, но может это и к лучшему. Будет меньше штамповщиков текста.

И еще, такой вариант был бы особенно хорош после разделения выдачи на сайты и каналы (что нам обещал господин Соболь). В противном случае, любое улучшение выдачи от каналов, приведет к росту дочиток у сайтов, которые не проверяются и жгут чудовищными нарушениями.