В VK рассказали, как формируется ваша лента рекомендаций

Возвращаем к оригиналу....

Алгоритмы помогают пользователю прорваться сквозь информационный шум, превращая хаотичный поток публикаций в ленту, максимально приближенную к его актуальным интересам, рассказал Александр Пославский, руководитель подразделения рекомендаций AI VK.

При этом системы рекомендаций специально оставляют «окно новизны», чтобы человек не оказывался в замкнутом информационном пузыре.

Что такое информационный шум

Информационный шум — это контент, который в данный момент не соответствует задачам или интересам пользователя. Когда объем публикаций растет быстрее, чем способность человека их переработать, без фильтров становится практически невозможно отделить важное от второстепенного.

Как работают алгоритмы рекомендаций

Современные рекомендательные системы — это связка из нескольких моделей машинного обучения, работающих поэтапно:

  • Сначала из огромного массива (миллиарды единиц контента) отбираются материалы, которые с наибольшей вероятностью могут заинтересовать конкретного пользователя. Для этого, с его согласия, анализируются:
    история просмотров и взаимодействий (лайки, репосты, досмотры, скрытия);
    характеристики самого контента — формат, тематика, ключевые объекты и сюжеты.
  • Затем система дообучается на свежих данных: если человек активно пользуется сервисом, профиль интересов постоянно уточняется; если заходит редко — алгоритмы опираются на устаревшую картину предпочтений, и качество рекомендаций падает.
  • На финальном этапе контент ранжируется: публикации располагаются в том порядке, который лучше всего соответствует текущим индивидуальным запросам, времени суток, частоте и длительности сессий, реакции на похожие материалы.

Так формируется «упорядоченная лента» вместо хаотичного потока — пользователь видит в первую очередь то, что с высокой вероятностью релевантно именно ему сейчас.

Как алгоритмы борются с «пузырем» и зачем подмешивают новизну

Чтобы человек не оказался в информационном коконе, современные алгоритмы намеренно включают в ленту часть материалов по новым или слабо знакомым темам.

Обычно доля такого «исследовательского» контента составляет около десятой части от всего трафика рекомендаций: этого достаточно, чтобы сочетать комфортно знакомое с потенциально «вдохновляюще новым», не перегружая пользователя.

Источники:
IT
5,67 млн интересуются
Добавить в корзинуПозвонить