Найти в Дзене
Медиа «Опыт»

Карта алгоритмов TikTok по версии The Washington Post: в чем суть

Информация с официального сайта TikTok гласит: алгоритм приложения учитывает «как другие взаимодействуют с контентом, чтобы улучшить ваш опыт», и запоминает «разнообразные действия, чтобы персонализировать контент». Эксперты The Washington Post провели свое исследование на основе данных профилей тысячи пользователей. Они представили алгоритмы TikTok в виде карты, которая состоит из множества точек. Каждая точка — отдельно взятое видео. Вместе они создают тематические сегменты, которые располагаются по степени связанности между собой. Чем чаще видео из разных сегментов смотрят вместе, тем ближе друг к другу они на карте алгоритмов. Подобные схемы формирования рекомендаций стали использовать после того, как их внедрили в Netflix около десяти лет назад. Например, видео на политические темы часто смотрят те, кому также интересен контент о психологическом здоровье и провокационные ролики. Поэтому если смотреть видео про политику, вскоре в ленте появится контент по психологии. В ленте любите

Информация с официального сайта TikTok гласит: алгоритм приложения учитывает «как другие взаимодействуют с контентом, чтобы улучшить ваш опыт», и запоминает «разнообразные действия, чтобы персонализировать контент».

Эксперты The Washington Post провели свое исследование на основе данных профилей тысячи пользователей. Они представили алгоритмы TikTok в виде карты, которая состоит из множества точек. Каждая точка — отдельно взятое видео. Вместе они создают тематические сегменты, которые располагаются по степени связанности между собой. Чем чаще видео из разных сегментов смотрят вместе, тем ближе друг к другу они на карте алгоритмов. Подобные схемы формирования рекомендаций стали использовать после того, как их внедрили в Netflix около десяти лет назад.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

Например, видео на политические темы часто смотрят те, кому также интересен контент о психологическом здоровье и провокационные ролики. Поэтому если смотреть видео про политику, вскоре в ленте появится контент по психологии. В ленте любителя компьютерных игр чаще будут попадаться ролики про технологии и сражения. А видео с котиками часто смотрят те, кому интересен контент о музыке.

Слабые стороны исследования

Версия WP, в отличие от реального алгоритма TikTok, не учитывает хэштеги и детали в содержании видео (например, текст или изображения). Сам TikTok заявил, что методология WP неполная и не «отражает реальность того, как работает система рекомендаций».

Несмотря на это, анализ метаданных показал, что ролики с одной и той же темой или хештегом действительно группировались вместе, как и сказано в исследовании.

Как работают хэштеги

Чем чаще пользователь видит одни хештеги, тем меньше вероятность увидеть другие — срабатывает принцип «или‑или». Если вам часто попадаются видео про малышей с отметкой #toddlersoftiktok, то ролики с хештегом #youtube будут появляться реже. Контент с хештегом #brainrot вытесняет ролики с меткой #husband. Так алгоритм TikTok старается показывать то, что, по его мнению, вам интереснее.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

Все дороги ведут к Тейлор Свифт: как алгоритм подбирает ролики для ленты

WP приводит в пример анализ нескольких профилей активных пользователей TikTok. Возьмем шестимесячную историю женщины из Айдахо (8800 видео). Согласно анализу, около 9 % ее ленты — ролики о психологии. Эта группа переплетена с сегментами видео о семье и любовных отношениях. Значит пользователи, которые видят видео о психическом здоровье, часто видят и ролики, посвященные отношениям: TikTok считает эти темы связанными. Если люди хотят получать меньше контента о психическом здоровье, им придется пропускать и видео об отношениях.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

Еще пользовательнице из Айдахо попадаются видео с котами (5%) и контент про Тейлор Свифт (9%). Помимо нее, десятки пользователей с похожими интересами встречали упоминания о певице как минимум в 5 % видео в ленте летом 2024 года во время ее большого тура.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

В случае контента с Тейлор Свифт золотой середины нет, поскольку ролики о ней связаны с множеством других тематических сегментов — от котов до спорта. Если вам не нравится поп‑звезда, но вы смотрите видео о других поп‑исполнителях или о команде Kansas City Chiefs (там играет жених Свифт), скорее всего, вы все равно будете натыкаться на ролики о ней.

Если же вы намеренно смотрите ролики с Тейлор и в вашей ленте много контента о ней, то это те же самые материалы, которые показывают всем остальным «свифти» (поклонникам Свифт). Поскольку контент о Свифт вызывает столь полярные реакции, примерно 1 500 видео о ней отображаются на карте как отдельный остров, а другие видео разбросаны по окраинам карты.

Сторитайм: великий и ужасный

В ходе другого исследования в рамках проекта WP изучили, что занимает пользователей TikTok, которые постепенно начинают проводить в приложении больше времени. Оказалось, что с большей вероятностью они видят контент в жанре «сторитайм». Это формат коротких роликов, где автор рассказывает личную историю, анекдот, смешной случай из жизни, или делится опытом. При этом использует соответствующий видеоряд, чтобы занять глаза зрителя. Или просто говорит прямо в камеру.

В некоторых примерах «сторитайма» роботизированный голос зачитывает дурацкие анекдоты, чтобы привлечь внимание пользователя на слух. При этом на экране демонстрируют несвязанные кадры.

Так, один из участников эксперимента проводил в TikTok около четырех дней каждый месяц летом 2024 года. Большинство из тех видео, что он смотрел дольше всего, расположены в сегменте «сторитайм».

Сочетать несочетаемое

Алгоритм TikTok показывает в ленте то, что понравилось пользователям с похожими интересами. Это значит, что некоторые, на первый взгляд не связанные ролики, оказываются рядом на карте, если многие пользователи с интересом смотрели их вместе.

Например, тридцатилетний мужчина из Бостона видит в ленте много роликов про инженерное дело и про комедийный сериал «Офис». Аналогично, контент о сериалах «Бриджертоны» и «Игра престолов» часто видят поклонники #booktok — раздела TikTok, в котором обсуждают книги.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

В то же время связанные темы могут располагаются далеко друг от друга. Например, так происходит в сегменте музыки. Причина проста: все любят разные жанры.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

Например, этот пользователь любит рэп‑музыку. Поэтому ему показали 271 видео с хештегом #notlikeus, который отсылает к конфликту Кендрика Ламара и Дрейка. При этом ему почти не попадался контент о поп‑музыке или Евровидении.

Конечно, лента каждого персонализирована. Ничто не мешает вам нарушить типичные шаблоны алгоритма: для этого нужно смотреть контент на какую‑либо тему — и одновременно на ее «противоположность». Например, и про Call of Duty, и про Ким Кардашьян. Или про брак — и про «Спанч Боба».

О том, как пол влияет на ленту

На левой стороне карты — видео, которые чаще смотрят женщины. Например, про книги и уход за кожей. На правой стороне те, что смотрят мужчины, включая ролики про видеоигры и спортивные автомобили. Темы фитнеса, путешествий и работы оказались в центре: ими одинаково интересуются и мужчины, и женщины.

ФОТО (Источник: The Washington Post)
ФОТО (Источник: The Washington Post)

Алгоритм, который использовали в The Post, изначально не получал данных про пол участников. Но в процессе выяснилось, что это один из ключевых факторов для формирования ленты.