Найти в Дзене
SkyDigital.pro

О кластеризации. Для маркетологов и категорийщиков. Объясняем на пальцах (огурцах)

Ранее мы подробно рассказывал об интересном кейсе сегментации покупательских корзин на основе чеков.
Для сегментации был использован математический алгоритм, который называется кластеризация. В результате применения этого алгоритма было выявлено 5 групп покупателей с разным поведением и предпочтениями. Мы получили большое количество вопросов и просьб рассказать подробнее о самом алгоритме и разъяснить, как он работает. Не будем лезть в глубокую математику, а объясним все на простом примере абстрактного магазина, где продаются всего два наименования товара - молоко и соленые огурцы :) ПРИМЕР Молоко всегда смешней, если после огурцов. Давайте проанализируем все чеки нашего условного магазина за определенный период, и нанесем на график данные о продажах. Каждая точка - это приобретенная корзина товаров одного покупателя или, что одинаково по смыслу, один чек. По вертикали отображаем количество упаковок молока в одной корзине, по горизонтали отображаем количество соленых огурцов в той же к

Ранее мы подробно рассказывал об интересном кейсе сегментации покупательских корзин на основе чеков.
Для сегментации был использован математический алгоритм, который называется
кластеризация. В результате применения этого алгоритма было выявлено 5 групп покупателей с разным поведением и предпочтениями.

Мы получили большое количество вопросов и просьб рассказать подробнее о самом алгоритме и разъяснить, как он работает.

Не будем лезть в глубокую математику, а объясним все на простом примере абстрактного магазина, где продаются всего два наименования товара - молоко и соленые огурцы :)

ПРИМЕР

Молоко всегда смешней, если после огурцов.

Давайте проанализируем все чеки нашего условного магазина за определенный период, и нанесем на график данные о продажах. Каждая точка - это приобретенная корзина товаров одного покупателя или, что одинаково по смыслу, один чек. По вертикали отображаем количество упаковок молока в одной корзине, по горизонтали отображаем количество соленых огурцов в той же корзине.

Т.е. если в чеке всего одна пачка молока, то мы ставим на графике точку с координатами (0,1) - «ноль банок огурцов и одна упаковка молока».

В итоге получаем некое облако точек.

Каждая точка отображает один чек. На осях отложено количество товаров в каждом чеке.
Каждая точка отображает один чек. На осях отложено количество товаров в каждом чеке.
Основная идея алгоритма кластеризации заключается в том, чтобы разбить объекты, в данном случае наши покупательские корзины, на группы по похожести признаков. В нашем случае признаками будут товары в этой корзине. Внутри одной группы эти объекты должны быть более похожи друг на друга, чем на объекты другого кластера.

Поскольку у нас всего два товара, нам не нужно никакой математики, чтобы увидеть на графике, что наши точки (чеки/корзины) сгруппировались в три кластера:

Кластер 1. Люди, которые покупают только молоко, от одной до трех пачек за раз.
Кластер 2. Люди, которые покупают соленые огурцы в количестве от трех до семи за раз.
Кластер 3. Отчаянные экстремалы, любители острых ощущений, у которых в корзине может быть одновременно и молоко и соленые огурцы.

Фактически мы провели примитивный кластерный анализ корзин, где идентифицировали три группы покупателей со своим характерным покупательским поведением и предпочтениями.

По результатам этого исследования категорийный менеджер нашего магазина может принять решение о расширении товарной матрицы, например, туалетной бумагой. И предлагать ее на кассе покупателям из третьего кластера в экономичной упаковке по 12 рулонов. Хотя пример простой и смешной, но он отображает всю суть.

Вот еще графики, где показаны более реальные примеры кластеризации. Опять же это случай простого двумерного пространства («молоко-огурцы»).

Набор данных без обработки.
Набор данных без обработки.

Алгоритм смог выделить три кластера из первоначальных данных.
Алгоритм смог выделить три кластера из первоначальных данных.

Более детализированный анализ тех же данных. Алгоритм смог выделить целых 5 различных кластеров!
Более детализированный анализ тех же данных. Алгоритм смог выделить целых 5 различных кластеров!

Но, к счастью, есть специальные математические алгоритмы, которые за нас решают эту проблему и сами разделяют корзины на группы по их похожести. Для реализации этих алгоритмов аналитики, как правило, используют языки программирования (Python, R и другие) и специальные библиотеки.

А вот что дальше делать с полученными результатами кластеризации, как их визуализировать и анализировать, какие можно делать выводы - читайте в нашей публикации:

Сегментация покупательских корзин алкомаркета. Реальный кейс. Data Science и BI в действии
SkyDigital.pro11 декабря 2023

В этой публикации мы показываем, как применять кластеризацию на практике. Вы можете увидеть, чем она может помочь в реальной жизни маркетологам, аналитикам, руководителям и другим людям, участвующим в бизнес процессах.

***
Гашпар Юрий, CEO - skydigital.pro. Data Science. Бизнес аналитика. Использование искусственного интеллекта, Big Data, социальных сетей в ритейле, маркетинге и рекламе.