Каждый смотрит кино по-разному. Иногда хочется узнать что-то новое и включить научно-популярную документалку, чаще — посмотреть громкую премьеру, которую все обсуждают. И у любого бывают вечера, когда лень долго выбирать кино, ворошить папку «Буду смотреть» и читать рецензии критиков, потому что хочется просто включить фильм или сериал, который поможет отвлечься и захватит аттракционом на экране. Кто-то для этого выберет легкое наивное кино, а кто-то — кровавое и динамичное. А как такие вечера выглядят для технологий и рекомендательной системы?
Рекомендательным алгоритмам бывает сложно разобраться в противоречивых сигналах от подписчика. Если он сохраняет в «Буду смотреть» Тарковского и Скорсезе, а вечером включает «Клюквенный щербет», какой фильм или сериал предложить следующим? В этом материале мы рассказываем о том, как изменились рекомендательные алгоритмы Кинопоиска за последние полгода и почему теперь они лучше справляются со своей задачей — подсказывают вам идеальное кино и угадывают, когда у вас настроение провести вечер с guilty pleasure.
Как устроены рекомендации
В онлайн-кинотеатре Кинопоиска вы привыкли видеть полки, содержание которых подбирают или редакторы Кинопоиска, или рекомендательная система. Причем в 90% случаев вы видите именно предложения алгоритмов, собранные для вас.
Конечно, самыми первыми на экране появляются громкие новинки и премьеры — именно их чаще всего ищут и смотрят наши подписчики. Персональные рекомендации состоят из фильмов и сериалов, которые алгоритм отобрал, ориентируясь на ваши действия в приложении или на сайте. Чтобы он реагировал чутче на ваши вкусы, важно взаимодействовать с интерфейсом — ставить оценку фильму или сериалу, добавлять кино в «Буду смотреть» или нажимать на «Неинтересно», если рекомендация не подходит.
Если в последнее время вы заметили, что рекомендации Кинопоиска стали лучше понимать вас, значит, наша новая нейросетевая модель уже хорошо научилась считывать сигналы о ваших предпочтениях.
В 2025 году Кинопоиск обновил рекомендательную систему. Теперь витрина онлайн-кинотеатра управляется нейросетевым ранкером, который пришел на смену CatBoost-модели, давнему стандарту индустрии. Система анализирует более 800 маркеров поведения подписчика — от любимых актеров и жанров до истории оценок в определенное время суток в зависимости от дня недели. Нейросетевой ранкер может выявлять более сложные закономерности в пользовательском поведении и учитывает широкий пользовательский контекст. Это значит, что система рекомендаций стала более гибкой и эффективной. Кроме того, с этого года персональные алгоритмы ранжируют сами подборки на экране. Теперь вероятность увидеть наверху витрины редкую, но интересную именно вам полку с фильмами и сериалами стала значительно выше.
Андрей Белобородов
руководитель группы рекомендаций Кинопоиска
Системы рекомендаций в разных сервисах Яндекса и даже у наших конкурентов довольно похожи. Творчество и пространство для улучшений лежит в области считывания и интерпретации сигналов от подписчиков. То, как мы опишем признаки этих сигналов, — важный момент для работы рекомендаций.
Эти признаки индивидуальны для каждого подписчика. К примеру, «фильм в жанре триллер» — это не признак, а «пользователь смотрел триллеры три раза в этом месяце» — признак. «Фильм с Сергеем Безруковым» не признак, а «пользователь поставил высшую оценку сериалу с Сергеем Безруковым» — признак. Таких признаков для каждого подписчика может быть больше 800. Нельзя сказать, чтобы какой-то из них был доминирующим. Да, алгоритму понятнее активное взаимодействие пользователя с контентом: оценка, добавление в «Буду смотреть» или «Неинтересно». Но и просмотр фильма или сериала — важный сигнал. Зрители не всегда говорят правду своими действиями. Бывает, что документальное кино могут отложить в «Буду смотреть», но никогда не включить. Преимущество машинного обучения в том, что оно учитывает многофакторные зависимости, это помогает рекомендательной системе быть немножко психологом для зрителя и рекомендовать необычное кино.
Что происходит, когда у подписчика настроение включить фильм из разряда guilty pleasure? Алгоритмы оценивают всю библиотеку Кинопоиска и показывают ему те фильмы и сериалы, которые получают наибольшее количество совпадений с его набором признаков. Конечно, для модели и фамилии актеров, и жанры фильмов не выглядят так, как для нас. То, что вы видите как guilty pleasure, система видит как набор цифр. Любое изменение модели влияет на то, какие фильмы попадают в выдачу. После перехода на нейросетевой ранкер систему пришлось доучить, чтобы она могла учитывать больше закономерностей. Ожидания и усилия оправдались: метрики просмотров выросли, а каталог стал использоваться эффективнее. Теперь рекомендации чаще предлагают фильмы, которые раньше оставались в тени популярных хитов. Шанс открыть для себя что-то новое стал выше, найти неожиданное guilty pleasure — тоже.
Как это сработало у меня: недавно алгоритм подкинул мне неожиданную идею на вечер. В обычном наборе из боевиков и фильмов Вуди Аллена в рекомендациях появился «Брат 2». Фильм, про который я забыл, а тут понял, что хочу его пересмотреть.
На большой выборке мы видим, что выросла популярность жанра фэнтези и семейного кино. В числе тайтлов, которые пользователи стали чаще смотреть, — «Невероятный мир глазами Энцо», «Белая птица: Новое чудо» и сериал «Энн».
Как алгоритм видит наши guilty pleasure
Рекомендательная система не получает от разработчиков инструкции в стиле «это кринж, а это топ». Алгоритму нельзя дать задачу показывать в рекомендациях больше мелодрам или комедий. Разработчики решают, какие данные показать модели для обучения и какой сигнал может быть более весомым, а она, в свою очередь, сама выбирает, что рекомендовать каждому зрителю, и работает как персональный кинокритик.
Если подписчик, который обычно интересуется новинками, смотрит редкий артхаус или старую драму с низким рейтингом, алгоритм фиксирует это как аномалию и может порекомендовать что-то похожее. А вот просмотр популярных комедий и мелодрам не выглядит для алгоритма чем-то необычным.
Когда все признаки и сигналы собраны, модель выдает каждому из них скор — числовую оценку того, что пользователь захочет посмотреть этот фильм или сериал. Чем выше скор, тем выше шанс появления контента в ленте. При этом учитываются как популярность контента для всех зрителей (а Кинопоиск смотрят 17 миллионов подписчиков в месяц), так и индивидуальные предпочтения подписчика и сигналы от пользователей, чьи вкусы схожи.
Модель склонна чаще присваивать высокие скоры популярному контенту, но универсального тайтла, который она рекомендует всем, не существует, как не существует и фильма, который смотрели все пользователи Кинопоиска. Даже хиты Гая Ричи или фильм «1+1», неизменно занимающий первые строчки в топ-250 Кинопоиска, некоторые предпочитают не включать.
Алгоритм может предлагать необычный контент, только если ему хватает данных о предпочтениях пользователя. Когда алгоритму недостаточно информации о пользователе, ему безопаснее рекомендовать только популярные у аудитории Кинопоиска фильмы, чтобы не ошибиться. Когда рекомендательная система ошибается, то есть показывает фильм, который вы не смотрите или отправляете в «Неинтересно», она получает штраф. Штраф выглядит как снижение влияния признака, на основе которого алгоритм сделал рекомендацию. Если подписчик смотрит фильмы и сериалы на основе предложений модели, признак, который она выбрала, получает большее значение в будущем, а если не смотрит — меньшее.
Что еще помогает делать рекомендации точнее
Алгоритм склонен чаще показывать популярный контент, а редакция онлайн-кинотеатра помогает делать рекомендации более релевантными. Например, если у франшизы скоро выйдет продолжение, предлагает пользователям пересмотреть предыдущие части. В онлайн-кинотеатре Кинопоиска поддерживается баланс между рекомендациями от технологий и людей.
Текстовые описания фильмов тоже помогают алгоритмам лучше понимать пользователей. Разумеется, для рекомендательной системы они выглядят как набор цифр или эмбеддинг. С их помощью система может понять, какие фильмы из библиотеки похожи на те, что уже нравятся подписчику, даже если он не ставил оценку и не взаимодействовал с интерфейсом.
Алгоритмы продолжат совершенствоваться, и подписчикам станет еще проще ориентироваться в каталоге, а также получать рекомендации для разного настроения. Артхаус и легкий сериал уже сейчас могут мирно сосуществовать в персональной подборке. Конечно, важно смотреть Кинопоиск со своего аккаунта, не забывать переключаться на детский режим, когда онлайн-кинотеатром пользуется ребенок. В рамках одной подписки подписчику доступно четыре аккаунта, и у каждого рекомендации будут своими. В будущем рекомендательная система научится улавливать не только ваши вкусы и рекомендовать идеальное guilty pleasure для одного человека, но и учитывать предпочтения всей семьи с одной подпиской. Выбирать фильм на вечер станет еще проще и быстрее.
20 самых популярных тайтлов на Кинопоиске, которыми не принято хвастаться
Феномен guilty pleasure индивидуален для каждого, поэтому невозможно составить единый топ захватывающих, но необычных фильмов для всех подписчиков Кинопоиска. Более того, большинство людей, когда их спрашивают про guilty pleasure, называют жанр или категорию, а не конкретный фильм или сериал. Кто-то предпочитает слэшеры, кто-то ужастики или реалити-шоу, а кто-то говорит: «Люблю включить треш всякий с оценкой ниже четырех». Мы проанализировали поведение подписчиков Кинопоиска и выявили три жанра-фаворита, которые чаще всего включают и досматривают до конца: это комедии, хорроры и документальное кино. Последнее рекомендательная система чаще всего трактует как аномальное смотрение. А вот 20 фильмов и сериалов, которые чаще всего встречаются в просмотренном у подписчиков, обычно предпочитающих совсем другое кино. И это не случайный выбор, а осознанный, с досмотром до финальных титров.
«Великолепный век. Империя Кёсем»
Турция, мелодрама, исторический
Оценка на Кинопоиске: 7.8
«Таракан»
Южная Корея, документальный
Оценка на Кинопоиске: 7.8
«Акулий торнадо»
США, ужасы
Оценка на Кинопоиске: 3.3
«Велоципастор»
США, Китай, ужасы
Оценка на Кинопоиске: 6.1
«Разлом»
Норвегия, боевик
Оценка на Кинопоиске: 6.3
«Форпост»
США, боевик
Оценка на Кинопоиске: 6.2
«Ежик в тумане»
Россия, мультфильм
Оценка на Кинопоиске: 8.4
«Наша Russia»
Россия, комедия
Оценка на Кинопоиске: 6.2
Comedy Woman
Россия, комедия
Оценка на Кинопоиске: 4.2
«Хвост Феи: Столетний квест»
Япония, аниме
Оценка на Кинопоиске: 8.2
«Самые милые существа»
Германия, реальное ТВ
Оценка на Кинопоиске: 8.8
«Самые опасные существа»
Германия, реальное ТВ
Оценка на Кинопоиске: 8.4
«Зеленые животные»
Южная Корея, документальный
Оценка на Кинопоиске: 8.8
«Криштиану Роналду: Единственные и неповторимый»
Великобритания, документальный
Оценка на Кинопоиске: 8.3
«Лев Яшин. Вратарь моей мечты»
Россия, документальный
Оценка: 7.9
«В бой идут одни „старики“»
СССР, военный, драма
Оценка на Кинопоиске: 8.7
«Дорожные войны»
Россия, документальный
Оценка на Кинопоиске: 7.4
«Зомби: Из Пусана в Гангнам»
Южная Корея, ужасы
Оценка на Кинопоиске: 4.4
«#Крикуны»
США, ужасы, детектив
Оценка на Кинопоиске: 4.1
«Лавлейс»
США, драма, биография
Оценка на Кинопоиске: 6.4