При поиске нового типа книги, фильма или ресторана ваш поиск может подсказать название или заведение, которое вы уже приобрели или в котором побывали. Это связано с тем, что инструменты искусственного интеллекта, на которые полагаются многие компании, загоняют пользователей в «пузырь фильтров», в результате чего рекомендации идентичны или очень похожи на то, что было приобретено ранее.
Команда ученых-программистов в настоящее время разработала способ преодолеть эти «пузыри» поиска с помощью алгоритма Pyrorank, который основан на взаимодействиях в экосистеме, имитирующих мир природы. Это достигается за счет уменьшения влияния профилей пользователей и расширения рекомендаций, которые по-прежнему отражают направленность поиска, что приводит к более разнообразным и полезным результатам. Работа опубликована в качестве доклада на конференции в журнале Advances in Swarm Intelligence.
«Когда дело доходит до вдохновения для решения задач в области компьютерных наук, природа – идеальное место для поиска», – объясняет Анасс Бари, доцент Института математических наук Куранта Нью-Йоркского университета и один из создателей алгоритма. «Природные явления, такие как птичьи стаи в поисках пищи, показывают, что природа часто может находить оптимальные, но простые решения для удовлетворения потребностей».
Рекомендательные системы, используемые, в частности, Google, Netflix и Spotify, представляют собой алгоритмы, которые используют данные для предложения или рекомендации товаров или вариантов выбора потребителям на основе прошлых покупок пользователей, истории поиска и демографических данных. Однако эти параметры искажают результаты поиска, поскольку помещают пользователей в «пузыри фильтров».
«Традиционный способ работы рекомендательных систем заключается в том, что рекомендации основываются на понятии сходства», – объясняет Бари, возглавляющий исследовательскую лабораторию прогнозной аналитики и искусственного интеллекта Института Куранта. «Это означает, что вы увидите похожие товары в списках выбора и рекомендуемых, основанных либо на похожих на вас пользователях, либо на похожих товарах, которые вы купили. Например, если я являюсь пользователем продуктов Apple, я буду видеть в своих рекомендациях все больше и больше продукции Apple».
Ограничения существующих рекомендательных систем стали очевидны поразительным образом. Например, политические сторонники могут быть в значительной степени ориентированы на новостной контент, который соответствует их ранее существовавшим взглядам. Что еще более важно, рекомендательные системы показали восприимчивым людям видеоролики о причинении себе вреда.
Чтобы решить эти проблемы, Бари и его коллеги создали Pyrorank, алгоритм, который учитывает контент, который ищет пользователь, собирая множество рекомендаций и в то же время уменьшая акцент на том, что пользователь уже приобрел или с чем взаимодействовал. Pyrorank функционирует как алгоритмическое «дополнение» к существующим рекомендательным системам.
«Это делает его легко адаптируемым по сравнению с заменой всего конвейера рекомендаций для продвижения диверсификации, что потенциально экономит много часов», — объясняет Бари.
Проверяя жизнеспособность алгоритма, исследователи сравнили результаты поиска, сгенерированные дополнением Pyrorank, с результатами традиционных рекомендательных систем, используя три больших набора данных — MovieLens, который предлагает пользовательские рейтинги фильмов, а также Good Books и Goodreads, в котором размещаются рейтинги книг читателей. Затем они провели серию экспериментов, чтобы определить, какие системы создают большее разнообразие рекомендуемого контента, оставаясь при этом верными целям основных рекомендаций.
В целом, системы, использующие Pyrorank, генерировали более разнообразные рекомендации, чем существующие, демонстрируя свою ценность в преодолении «пузырей фильтров».
В то же время, применяя Pyrorank к существующей системе рекомендаций, мы жертвуем прогностической точностью — ошибкой в предсказании того, насколько пользователю понравятся рекомендации — для увеличения разнообразия рекомендуемых элементов. Однако этот компромисс легко настраивается для конкретных случаев использования, говорят исследователи.
«Вы можете применить очень небольшую настройку разнообразия и по-прежнему получать большие выгоды в диапазоне результатов, лишь незначительно снижая точность прогнозирования», — объясняет Бари. «Каждый случай будет отличаться, в зависимости от контекста системы рекомендаций. Хотя между разнообразием и точностью существует некоторая взаимосвязь, рекомендательные системы можно откалибровать, чтобы поддержать неоднородность результатов поиска при минимальных потерях точности».
«Успешные рекомендательные системы должны уметь распознавать и смягчать предубеждения пользователя, что приводит к более эффективным рекомендациям и долгосрочному здоровью этих платформ», — добавляет он. «Разработка алгоритмов для определения приоритетности рекомендаций и диверсификации поиска — важный шаг в борьбе с негативными последствиями и ограничениями существующих рекомендательных систем».