Найти в Дзене

Создание идеальной рекомендательной системы: секреты Embeddings для максимальной точности и удовлетворенности пользователей

Оглавление
   Как создать идеальную рекомендательную систему:Secrets of Embeddings для повышения точности и удовлетворенности пользователей Юрий Горбачев
Как создать идеальную рекомендательную систему:Secrets of Embeddings для повышения точности и удовлетворенности пользователей Юрий Горбачев

Как работают рекомендательные системы с использованием эмбеддингов? Узнайте о ключевых методах и преимуществах для точных рекомендаций!

Введение в рекомендательные системы с использованием embeddings

Рекомендательные системы стали неотъемлемой частью современного онлайн-опыта, помогая пользователям находить релевантный контент в море информации. Одним из ключевых инструментов в построении этих систем являются эмбеддинги (embeddings), которые позволяют представлять пользователей и товары в виде плотных векторных представлений. В этом обзоре мы глубоко погрузимся в мир эмбеддингов для user-item взаимодействий и рассмотрим, как они используются в классических рекомендательных системах.

Что такое embeddings?

Эмбеддинги — это плотные векторные представления, которые capture основные характеристики и отношения между пользователями и товарами в многомерном пространстве. Эти векторы позволяют выявлять сходства и различия между объектами, что крайне важно для построения точных рекомендаций.

Пример: векторные представления пользователей и товаров

В рекомендательных системах, таких как те, которые используются на маркетплейсах или в музыкальных сервисах, матрица взаимодействий (user-item matrix) играет ключевую роль. На каждой строке этой матрицы стоят пользователи, а в каждом столбце — товары. На пересечении пользователя и товара записано их взаимодействие, которое может быть явным (например, оценки, лайки) или неявным (например, клики, пропуски).

Обучение эмбеддингов

Метод Word2Vec для user-item взаимодействий

Одним из эффективных способов обучения эмбеддингов является использование метода Word2Vec, особенно в его вариации skip-gram. В традиционном подходе, Word2Vec обучается на сессиях пользователей, где каждый товар представляет собой отдельное слово. Однако, этот метод не учитывает тип взаимодействия пользователя с товаром, что может быть критически важным для точности рекомендаций.

Учет типа взаимодействия

Чтобы решить эту проблему, можно обучать эмбеддинги для пар (товар, тип взаимодействия). Например, вместо того, чтобы просто использовать идентификатор товара, можно использовать пары (item, interaction), где interaction может быть purchase, add-to-cart, favorite или view. Это позволяет лучше различать вектора, связанные с разными действиями над одним и тем же объектом.

Генерация негативных примеров

При обучении skip-gram необходимо генерировать негативные примеры. Авторы статьи предлагают генерировать дополнительные негативные примеры, учитывая тип взаимодействия с товаром. Например, для положительного примера (item, purchase) можно использовать негативные примеры (item, add-to-cart) или (item, view), если эти пары не встречаются в сессии. Это улучшает различимость векторов, связанных с разными действиями.

Поиск товаров-кандидатов

Использование обученных эмбеддингов

Обучив эмбеддинги для пар (товар, тип взаимодействия), их можно использовать для поиска товаров-кандидатов. Например, можно взять последние N товаров, которые просмотрел пользователь, найти для них ближайших соседей по эмбеддингам и объединить полученные множества. Этот подход позволяет построить более интерпретируемые и понятные для пользователя рекомендации, типа “Because you X this, you may also want to Y that”.

Offline и online эксперименты

В статье также сравниваются различные методы построения множества товаров-кандидатов как в рамках offline экспериментов, так и в рамках online AB тестов. Например, метод View-Interaction, который строит множество кандидатов на основе последних 4 товаров, просмотренных пользователем, показал существенный рост CTR и других метрик в сравнении с производственной системой.

В следующей части мы продолжим рассмотрение классического пайплайна рекомендательной системы, более подробно остановимся на ранжирующей модели и методах коллаборативной фильтрации, а также исследуем преимущества использования эмбеддингов в рекомендательных системах.
Подпишитесь на наш
Telegram-канал

Классический пайплайн рекомендательной системы

После выбора товаров-кандидатов следующим важным этапом в пайплайне рекомендательной системы является использование ранжирующей модели.

Ранжирующая модель

Ранжирующая модель ответственна за создание перестановки объектов в порядке убывания рейтинга для конкретного пользователя. Входными данными для такой модели обычно являются признаки пользователя и объекта, на основе которых генерируется числовая оценка. Эта оценка показывает степень релевантности объекта пользователю. Объекты ранжируются на основе этой оценки, и самые релевантные показываются пользователю первыми.

Коллаборативная фильтрация

Другим популярным методом в рекомендательных системах является коллаборативная фильтрация. Этот метод задействует историю взаимодействий между пользователями и товарами для выявления схожих пользователей и рекомендации товаров на основе этой схожести. Эмбеддинги, особенно те, что учитывают тип взаимодействия, могут значительно улучшить этот процесс, предлагая более точные и релевантные рекомендации.

Преимущества использования embeddings

Включение эмбеддингов в рекомендательные системы предоставляет ряд значительных преимуществ.

Интерпретируемость и понятность

Системы, использующие эмбеддинги, обеспечивают высокую степень интерпретируемости результатов. Пользователи могут понять логическую связь между своими действиями и предлагаемыми рекомендациями, что увеличивает их удовлетворённость и доверие к системе.

Улучшение точности

Благодаря тому, что эмбеддинги позволяют точно различать объекты на основе разнообразных взаимодействий, точность рекомендаций значительно улучшается. Это особенно важно в средах, где требуется высокая персонализация.

Визуализация и анализ

Использование техник визуализации, таких как t-SNE или UMAP, для проекции эмбеддингов в низкоразмерное пространство позволяет анализировать и интерпретировать сложные модели данных. Это дает возможность выявлять неочевидные паттерны и кластеры взаимодействий, что приводит к глубокому пониманию предпочтений и поведения пользователей.

Заключение

Рекомендательные системы, основанные на усовершенствованных технологиях обработки данных, таких как эмбеддинги, представляют собой мощный инструмент для персонализации пользовательского опыта. Эмбеддинги придают системе гибкость и адаптивность, делая рекомендации не только точными, но и понятными для конечных пользователей. Продолжая развивать и интегрировать новые методики, как word2vec с учётом типа взаимодействия, разработчики могут добиваться значительного улучшения в работе рекомендательных систем. Подобные инновации открывают новые возможности для бизнеса по удержанию клиентов и увеличению их лояльности.

Таким образом, интегрируя эмбеддинги в рамках рекомендательных систем, можно значительно усовершенствовать взаимодействие с пользователем, обеспечивая ему релевантные и ценные предложения, которые будут отвечать его интересам и предпочтениям.

Ссылки:

Подпишитесь на наш Telegram-канал