Найти тему
Дмитрий Коваленко

Рекомендательные алгоритмы VS Подписочные модели

Оглавление
Изображение с сайта: https://www.deutschland.de/ru/topic/ekonomika/
Изображение с сайта: https://www.deutschland.de/ru/topic/ekonomika/

Здравствуйте дорогие друзья, меня зовут Дмитрий, а это статья в стиле «О сложном простыми словами» и сегодня мы с вами разберём противостояние рекомендательных алгоритмов и подписочных моделей. Итак, поехали😊

В начале определимся, что такое в принципе "алгоритм". Итак, алгоритм - это как определённый рецепт - ты выполняешь всю последовательность действий - и получаешь в конце приготовленное блюдо. Или если "научным" языком:

Алгоритм — это совокупность точно заданных правил решения некоторого класса задач или набор инструкций, описывающих порядок действий исполнителя для решения определённой задачи.

История алгоритмов и для чего они нужны

История

История алгоритмов начинается с аль-Хорезми, персидского математика, чье имя стало основой для слова "алгоритм". Его работы в области алгебры и арифметики заложили основу для развития математических алгоритмов.

С тех пор алгоритмы прошли долгий путь развития. Они стали ключевым элементом в программировании и информатике, позволяя решать всё более сложные задачи. С развитием компьютерных технологий алгоритмы стали основой для создания эффективных и мощных программ.

Применение алгоритмов

  • Алгоритмы сортировки: Они позволяют упорядочить данные для их более эффективного использования.
  • Поиск кратчайшего пути: Эти алгоритмы используются в GPS-навигации и сетевых технологиях для нахождения оптимального маршрута.
  • Криптография: Алгоритмы шифрования защищают нашу информацию в интернете.
  • Машинное обучение: Алгоритмы используются для обучения компьютеров распознаванию образов, обработке естественного языка и принятию решений.

Последнее - Машинное обучение - и есть основа систем рекомендаций.

Рекомендательные алгоритмы – это технология, которая позволяет на основе анализа данных о пользователе предлагать ему соответствующие его потребностям товары, услуги и цифровой контент.

Рекомендательные алгоритмы можно сравнить с продавцом-консультантом, который готов помочь с поиском товара, сообщить о похожих товарах. Отличие рекомендательного алгоритма от продавца в том, что последний, как правило, ничего о вас не знает, а рекомендательному алгоритму может быть известно даже то, что вы, возможно, предпочли бы никому не рассказывать.

Иными словами, рекомендательный алгоритм – это инструмент для бизнеса, с помощью которого можно значительно увеличивать продажи, расширять и удерживать аудиторию.

Международная консалтинговая компания Mc Kinsey&Company отмечает, что рекомендательные алгоритмы генерируют 35% продаж для компании Amazon, а на платформе Netflix 75% контента, к которому пользователи проявляют интерес, предлагается рекомендательными алгоритмами. Кроме того, алгоритмы являются основной бизнес-моделей для таких цифровых платформ, как TikTok, YouTube, Tinder и др.

Вы, наверное, знаете, что когда вы используете свой телефон или компьютер, то они могут учиться делать разные вещи, например, распознавать лица или предлагать музыку, которая тебе нравится? Это все благодаря такой штуке, как машинное обучение. И это не является новостью, развитие в этой области началось еще в 50-х годах прошлого века! Тогда ученые придумали математические способы и создали модели, которые позволяют компьютерам учиться. Такие вещи, как "наивный байесовский классификатор" или "искусственная нейронная сеть", это инструменты, которые помогают компьютерам учиться и выполнять разные задачи.

Начало развития рекомендательных систем

В конце 1990-х появился первый видеомагнитофон, который пытался понять, что людям нравится, чтобы автоматически записывать подходящие передачи. Устройство называлось TiVo, и его продавали под брендами, такими как Sony и Philips. Тогда не было устройств, которые могли бы детально описать все передачи, и компьютеры не были достаточно мощными для сложных вычислений. Поэтому для рекомендаций использовался алгоритм, который назывался коллаборативной фильтрацией.

Картинка с сайта: https://timeweb.com/ru/community/articles/chto-takoe-rekomendatelnye-sistemy-i-kak-rabotayut-algoritmy-rekomendaciy
Картинка с сайта: https://timeweb.com/ru/community/articles/chto-takoe-rekomendatelnye-sistemy-i-kak-rabotayut-algoritmy-rekomendaciy

Первый этап

Так вот представим, что у нас есть TiVo , которая записывает твои любимые передачи автоматически. Когда люди в разных домах выбирают похожие шоу, видеомагнитофон начинает предлагать новые передачи, которые могли бы им понравиться. TiVo отправляет данные на специальный компьютер, который сравнивает выборы разных людей и делает рекомендации для каждого. Это помогает находить людей с похожими вкусами и не перегружать магнитофон, который при этом не является сильно умным. Вот только иногда система ошибается и предлагает что-то странное. Например, есть истории, когда TiVo рекомендовал достаточно странные фильмы, и люди из-за этого были в шоке. Но в целом, такой подход быстро стал популярным. Чемпионом применения стала компания Netflix, которая для своего бизнеса предоставления DVD-дисков в аренду привлекла команду разработчиков, настраивающих параметры рекомендательного движка коллаборативной фильтрации, и добивалась год от года все лучших результатов.

В середине 2000-х коллаборативная фильтрация, которая помогала предлагать фильмы, достигла своего предела, то есть она больше не могла сделать рекомендации точнее. Тогда Netflix устроил конкурс - Netflix Prize, чтобы улучшить систему. Лучшие команды работали над этим три года и улучшили точность рекомендаций на 10%, но их идеи были слишком дорогими для практического использования. Поэтому коллаборативная фильтрация перестала быть основным методом для рекомендаций фильмов.

Второй этап

Во второй этап развития рекомендательных систем переходят к фильтрации по контенту, то есть к тонкому анализу информации о фильмах и шоу. Новые компании, такие как Jinni и Aprico, начали создавать системы, которые понимают, какие фильмы подходят пользователям и почему. Например, если вы смотрите фильмы боевики, но не смотрите триллеры, система понимает, что ты любишь боевики, но не триллеры. Netflix тоже заметил этот подход и начал разрабатывать свои описания и классификации для своих фильмов. Однако этот метод имеет свои проблемы, особенно с масштабированием, когда каталог фильмов становится очень большим. Его каталог жанров быстро вырос с исходных 560 вариантов до 93 116. При этом в каталог «эмоциональные драмы 80-х, получившие высокую оценку кинокритиков», вошли всего лишь 2 фильма. Другие компании сосредотачиваются на классификации фильмов по уже существующим данным.

Третий этап

Третий этап развития рекомендательных систем - это анализ контекста, где учитываются интересы и настроения пользователя. Вместо простого предложения фильмов, система должна учитывать, что вы чувствуете и что вам нравится. Например, если вы не любите Дженнифер Лопес, а фильм вам предлагают из-за нее, вы должны иметь возможность сразу это указать и получить другие варианты. Netflix уже работает над этим, чтобы системы могли давать рекомендации именно в тот момент, когда вы этого хотите, учитывая все ваши предпочтения и настроение.

Оценка рекомендательной системы

Оценка качества рекомендательной системы - это важный шаг, но он сложен из-за того, что каждый понимает "качество" по-разному. Есть два способа проверки системы:

  1. Оффлайн тестирование: проверяем модель на старых данных, используя специальные тесты.
  2. A/B тестирование: запускаем несколько вариантов и смотрим, какой работает лучше.

Часто используется кросс-валидацию для оценки качества модели. Это методы leave-one-out и leave-p-out, где мы обучаем модель на всех данных, кроме одного или нескольких, а затем проверяем, насколько хорошо она справляется с этими исключениями. Метрики качества можно поделить на три группы: они оценивают точность предсказанных рейтингов, полезность рекомендаций и правильность ранжирования рекомендаций. Но, к сожалению, нет одной универсальной метрики, каждый выбирает ту, которая лучше подходит его целям.

Теперь давайте рассмотрим рекомендательные системы в онлайн магазинах. Они обычно хотят две вещи: сначала, рассказать тебе о товарах, которые могут тебе понравиться, а потом, побудить тебя к покупке. Когда мы оцениваем эффективность этих систем, мы смотрим только на то, сколько дополнительных покупок они спровоцировали. Если человек купит какой-либо товар без рекомендации, то это не считается. Lift — показатель того, во сколько раз точность модели превосходит некий baseline алгоритм. Это помогает понять, насколько хорошо работает модель и какие рекомендации лучше.

Пользовательское поведение довольно сложно понять, и ни одна метрика не может полностью объяснить, что происходит в голове человека, когда он выбирает товар. Можно узнать немного больше, наблюдая за тем, что делает пользователь на сайте, какие рекомендации он видит и переходит ли на них, а также какие фичи системы он предпочитает. Для сравнения разных методов или проверки новых идей делат A/B тестирование и смотрят, какой подход работает лучше. Второй способ - спрашивать у пользователей, что они думают. Мы задаем им вопросы, чтобы узнать, что для них важно при выборе товаров и как они используют наш сервис. Это помогает нам получить прямой ответ на наши вопросы. Это важно для крупных рекомендательных сервисов, потому что они должны знать, что пользователи думают и как они реагируют на рекомендации.

Из известных методов анализа наиболее популярны 4:

  • Ассоциативные правила - это как выявление паттернов в том, что люди часто покупают вместе. Например, если кто-то купил молоко, то часто они также купят и хлеб. Это помогает магазинам предлагать свои товары в уместное время.
  • RBM (ограниченные машины Больцмана) - это старый метод, который использует нейронные сети для поиска общих паттернов в предпочтениях пользователей. Этот метод не создавался специально для рекомендаций, но он помогал в решениях, как, например, в конкурсе Netflix Prize.
  • Автоэнкодеры - это еще один метод, который использует нейронные сети, чтобы понять, что интересует пользователя. Они убирают избыточные данные и оставляют только важную информацию.
  • DSSM (глубокие семантические модели схожести) - это новый подход, который также использует нейронные сети, чтобы сравнивать запросы и документы. Это помогает понять, какие товары могут заинтересовать пользователя.

Алгоритмы каждой компании уникальны. Для их создания и постоянного улучшения нанимается целый штат IT-специалистов. В результате их труда у компании появляется дорогостоящий IT-актив, имеющий статус коммерческой тайны, принципы работы которого программистам запрещается разглашать. Поэтому в общем доступе мы не сможем найти точные сведения о принципах работы алгоритмов компаний.

Однако общие принципы работы рекомендательных алгоритмов все же известны. К примеру, в одной из статей описывается следующая классификация алгоритмов:

  1. Популярное: Это когда предлагают то, что нравится многим. Просто и не персонально.
  2. Похожее на ваше прошлое: Здесь учитываются ваши предпочтения, но без использования больших данных.
  3. Совместное ранжирование с учетом ваших предпочтений: Учитываются ваши действия и предпочтения, чтобы дать более точные рекомендации, но нужно много данных.
  4. Категории интересов: Здесь вас классифицируют по интересам и рекомендуют соответствующий контент, но нужно много данных для точности.
  5. Гибридное ранжирование: Это смесь всех предыдущих методов. Эффективно, но сложно и дорого в настройке.

Рекомендательные алгоритмы помогают пользователям находить нужную информацию в огромном потоке данных. Это как помощник, который подсказывает, что вам может быть интересно, даже если ваш запрос не очень точен.

Однако нужно помнить, что эти алгоритмы в первую очередь созданы для компаний, чтобы помочь им продавать больше. Из-за этого появились и некоторые проблемы.

Вот некоторые проблемы, связанные с использованием рекомендательных алгоритмов:

  1. Спонтанные покупки: Алгоритмы могут побуждать к покупкам, даже если пользователь не планировал этого. Например, когда реклама появляется в момент, когда вы о чем-то думаете. Это может привести к тому, что люди делают спонтанные покупки, даже если им не нужно ничего покупать.
  2. Зависимость от цифрового контента: Когда алгоритмы показывают вам контент, который вам нравится, вы можете проводить слишком много времени в интернете. Это может сделать вас зависимым от постоянного просмотра контента.
  3. Заложники рекомендаций: Вы можете стать заложником своей ленты рекомендаций, потому что алгоритмы будут постоянно показывать вам то, что они думают, что вам нравится, вместо того, чтобы позволить вам сами выбирать, что смотреть.
  4. Манипуляция и пропаганда: Владельцы платформ могут использовать алгоритмы, чтобы влиять на ваше мнение, показывая вам только определенный контент, который им выгоден. Это может быть использовано для распространения политической пропаганды или в недобросовестной конкуренции в бизнесе.

Теперь поговорим о подписочных моделях.

Подписочные модели

Во многом на развитие современных подписочных сервисов повлиял Netflix, который уже в «нулевых» работал по необычной модели.

Картинка с сайта: https://app2top.ru/industry/kakie-problemy-zhdut-netflix-na-ry-nke-videoigr-konkurentsiya-s-fortnite-i-gonka-za-tehnologiyami-189884.html
Картинка с сайта: https://app2top.ru/industry/kakie-problemy-zhdut-netflix-na-ry-nke-videoigr-konkurentsiya-s-fortnite-i-gonka-za-tehnologiyami-189884.html

В начале 2000-х Netflix стал популярным благодаря своей уникальной модели доставки DVD. Пользователи могли выбирать фильмы онлайн, и компания отправляла им диск по почте. Это стало возможным благодаря развитой почтовой системе в США. Эта идея помогла Netflix стать одним из лидеров рынка стриминга.

История заказов по почте уходит в далекое прошлое, начиная с XV века, когда каталоги товаров начал издавать Альд Мануций. Однако, Бенджамин Франклин, основатель почтовой системы в США, внёс существенный вклад, предоставив возможность заказывать товары по почте в 1744 году. Это стало важным для американцев, особенно для тех, кто жил в отдаленных районах.

Первыми, кто воспользовался этой идеей, были продавцы семян и растений, затем присоединились издатели и прочие продавцы. Благодаря им, даже в самых отдаленных местах США стало доступно множество товаров. Почтовые каталоги того времени использовали новейшие технологии, чтобы привлечь покупателей, включая яркие картинки.

В 1955 году Columbia Records запустил Columbia Records Club, предлагая подписки на музыкальные записи для тех, кто жил в сельских районах. В начале 1970-х годов все подразделения клуба объединились под брендом Columbia House, который стал популярным среди американцев, родившихся в 70-е, 80-е и 90-е годы. Подписчики получали музыку в виде посылок, пока не отписывались от клуба. Некоторые использовали это, чтобы получать записи бесплатно, а для других это был первый опыт кредитных выплат. В период с 1994 по 1996 годы клуб достиг пика популярности, набрав 16 миллионов подписчиков, но в 2015 году обанкротился из-за конкуренции с интернетом.

В 2010-е годы в США начался бум подписочных сервисов. Dollar Shave Club был одним из первых, предлагая доставку потребительских товаров по подписке. Его выручка выросла до $152,4 миллиона в 2015 году, и в 2016 году его купила компания Unilever.

Но на самом деле популярность подписочной модели еще обусловлена развитием digital. Развитие интернета и появление стриминговых сервисов, таких как Apple Music и Netflix, стали возможными благодаря увеличению скорости интернета. Раньше нужно было скачивать файлы, а теперь контент доступен в режиме онлайн, что делает подписочные сервисы более популярными. Около 70% всех бизнесов с подписочной моделью находятся в США, что свидетельствует о различиях в менталитете потребителей и уровне развития интернет-инфраструктуры за рубежом.

Успешный бизнес по подписке следует четырем правилам:

  1. Прогнозируемость спроса: Бизнес должен предсказывать, как часто пользователи будут пользоваться его товаром или услугой. Например, доставка еды требует понимания, сколько раз в неделю пользователи будут заказывать еду.
  2. Ценность для пользователя: Товар или услуга должны быть значимыми для пользователя. Например, заказ еды удовлетворяет базовые потребности человека, поэтому он скорее всего будет заказывать еду регулярно.
  3. Массовое производство: Товар или услуга должны быть легко производимыми в больших объемах.
  4. Бесплатные дополнительные сервисы: Помимо основного товара или услуги, пользователю должны предоставляться дополнительные сервисы или интеграции, такие как служба поддержки или триал-версии, чтобы поддерживать интерес к подписке.

Понимание модели подписки в digital и офлайне важно, потому что они отличаются. В офлайне подписка применяется к повседневным товарам, коробкам с подарками и специализированным товарам. Ограниченный список, потому что только эти сферы соответствуют основным правилам подписочного бизнеса. В отличие от digital, в офлайне есть дополнительные расходы на доставку. В digital можно подписываться на любой контент, сервис или образование.

Контент

Подписка на контент проста: это аудио, видео и тексты, доступные онлайн. Онлайн-кинотеатры, как ivi и Start. Они растут, потому что люди хотят смотреть контент без скачивания сразу на любом устройстве. Это выгодно и для производителей контента, потому что они гарантированно находят аудиторию. Концепция подписки также работает в специализированных СМИ, предлагая уникальный и интерактивный контент, как у "Тинькоф Журнал".

Сервисы

Подписка часто используется для сервисов, от трекеров задач до программ типа Photoshop или After Effect. Раньше программы покупались раз и на долго, но теперь они предлагаются как услуги с обновлениями и поддержкой.

Образование

Образование включает контент и сервисы, так как предлагает материалы с удобным интерфейсом, кураторской поддержкой и другими удобствами. Оно следует основным правилам успешного бизнеса по подписке:

  • Контент легко масштабировать и имеет понятную ценность для пользователя, который приходит с конкретным запросом, например, "хочу научиться маркетингу в социальных сетях".
  • Контент потребляется регулярно, так как образование должно быть последовательным. Успешные примеры в России: Bang Bang Education и "Нетология", которые предлагают разные варианты подписки на курсы. Образовательные сервисы часто используют несколько моделей монетизации. Кроме того, проекты с подпиской лучше работают в бизнес-сфере, где компании не хотят менять продукты, особенно если они важны для производственных процессов.

Главные проблемы бизнеса по подписке

  1. Многие крупные игроки предпочитают доставку по запросу, особенно в офлайн-бизнесе, например, розничные сети типа "Азбука Вкуса" или "Перекресток". При таком подходе подписка теряет смысл, потому что люди могут получить товар в течение часа, а не ждать поставок на полгода.
  2. Подписка может быть экономически неудачной для покупателей. Если раньше они платили за товары отдельно, они могли в итоге потратить меньше, даже если общая сумма была выше. Подписка может казаться дешевле, но если она приводит к неудобствам для пользователей, это может уменьшить их покупательскую способность и нанести ущерб бизнесу.
  3. В России мало успешных примеров использования подписочной модели в офлайн-бизнесе, особенно в доставке товаров на каждый день. Это связано с недоверием российских пользователей к таким сервисам.
  4. Высокие затраты на удержание клиента. В модели подписки нет места ошибкам, так как любое неудачное обслуживание может привести к отмене подписки пользователем.

С 2006 года подписки делятся на 2 типа:

моносервисные, то есть предлагающие только один вид услуг — как Spotify, где можно только послушать музыку, или Амедиатека, где есть лишь фильмы и сериалы;

мультисервисные — пакетные предложения, экосистемы из нескольких сервисов, как описанный выше Amazon Prime, а также Яндекс Плюс, в который входит музыка, онлайн-кинотеатр, скидки на такси и каршеринг.

Мультисервисная модель сегодня считается более успешной и устойчивой — она помогает лучше удержать внимание клиента, ведь он получает не один, а сразу несколько сервисов. В итоге он привыкает к тому удобству, которое ему дает подписка, и ему уже не так-то просто от нее отказаться. Сейчас такие подписки очень популярны — например, Яндекс Плюс, СберПрайм, МТС Премиум, VK Combo и Тинькофф PRO, которая изначально была подпиской на банковские услуги, но сейчас по ней можно даже посмотреть кино.

Российская специфика

В России развитие сервисов подписок имеет свои особенности, особенно в ценовом плане. В США и Европе люди привыкли платить за контент, так как эта индустрия существует там уже давно. Однако в России такой опыт пришел позже, в 90-е годы, и в то время пиратский контент был очень популярен из-за его доступности. Для привлечения пользователей к стриминговым сервисам цена играла ключевую роль, поэтому подписки были доступны по низкой цене.

В России цены на подписки существенно ниже, чем в Европе и США. Например, Netflix стоит около 1150 рублей в месяц, а IVI — всего 400 рублей. Этот подход удобен для клиентов, но не очень выгоден для компаний. Многие российские сервисы подписок работают с убытками из-за небольшой аудитории. Например, в 2021 году IVI показал чистый убыток в 2,1 млрд рублей, а OKKO и Сберзвук — по 2,6 млрд рублей каждый квартал. У российских сервисов меньше возможностей окупить расходы на контент за счет роста подписчиков из-за небольшой аудитории.

Но несмотря на все это, российские стриминговые сервисы продолжают следовать мировым тенденциям и развиваться — например, снимать свои эксклюзивные сериалы. «Домашний арест», «Звоните ДиКаприо», «Эпидемия», «Happy End», «Вампиры средней полосы» — эти и другие шоу, ставшие настоящими хитами, сняты именно стриминговыми платформами.

Немного о подписках Дзэн

Дзэн обновил раздел "Подписки", чтобы пользователи могли легче находить любимые каналы, на которые они подписаны. Теперь список каналов отображается в хронологическом порядке с наиболее актуальными публикациями. Пользователь видит название канала, начало текста последней публикации и количество непрочитанных публикаций. Они могут перейти в каналы авторов или просмотреть новые публикации. В десктоп-версии лента доступна справа от меню с каналами, а в мобильном приложении нужно нажать кнопку "Все подписки". Вверху ленты есть кнопки для фильтрации контента по форматам. Обновленный интерфейс уже доступен в веб-версиях и мобильных приложениях Дзэн для Android, а скоро будет и на iOS.

#КонтентRun "Технологии", #контент-гонка #технологии