💬 RFM-анализ — это метод сегментации клиентской базы, основанный на 3 показателях потребительского поведения. RFM: Recency (давность), Frequency (частота) и Monetary (денежность).
RFM-анализ — это один из основных инструментов в арсенале продуктового аналитика. Он позволяет сегментировать пользователей на основе их реального поведения.
Как продуктовый аналитик проводит RFM-анализ? Какие данные нужны?
Для RFM-анализа нужны транзакционные данные. Обычно это таблица, где каждая строка — это одна покупка (или любое другое целевое событие, например, оплата подписки).
Минимальный необходимый набор данных
- user_id — уникальный идентификатор пользователя.
- transaction_date — дата и время покупки (или целевого действия).
- transaction_amount — сумма покупки (или ценность действия).
Часто используются и другие данные для более глубокого анализа
- product_id или category — чтобы анализировать поведение в разрезе товаров/категорий.
- transaction_id — для уникальной идентификации транзакции.
⚠ Важный нюанс: необходимо определить анализируемый период. Нельзя брать «все данные за все время». Нужно выбрать окно анализа (например, последние 12 месяцев) и фиксированную дату «на сегодня», относительно которой будут считаться показатели.
RFM-анализ пошагово
Шаг 1. Расчет R, F и M для каждого пользователя
На этом этапе агрегируем сырые транзакции до уровня пользователя.
Recency
- Recency (R — давность): как давно пользователь был активен.
- Расчет:
Текущая_дата – Дата_последней_покупки_пользователя. - Пример: если сегодня 1 ноября 2025, а пользователь последний раз покупал 25 октября, разность равно 7 дней, т.е. Recency = 7.
⚠ Чем меньше число, тем лучше.
Frequency
- Frequency (F — частота): как часто пользователь совершает целевые действия.
- Расчет: количество уникальных транзакций пользователя за анализируемый период.
- Пример: пользователь сделал 5 заказов за последний год. Его Frequency целевого действия = 5.
⚠ Чем больше число, тем лучше.
Monetary
- Monetary (M — денежность): сколько денег пользователь принёс компании.
- Расчет: общая сумма всех покупок пользователя за анализируемый период.
- Пример: пользователь потратил в сумме 25 000 р. Его Monetary = 25 000.
⚠ Чем больше число, тем лучше.
💬 Итог шага: таблица с колонками id, R (в днях), F (в штуках), M (в денежных единицах):
id | R | F | M
1 | 7 | 5 | 25000
2 | 9 | 8 | 5000
3 | 3 | 2 | 1000
...
Шаг 2. Присвоение R-, F-, M-баллов
Каждого пользователя оценить по шкале, например: от 1 до 3 или от 1 до 5 или 1 до 10. Чаще всего используют 3-бальную шкалу для простоты интерпретации. Чем балл, тем выше ранг.
Для Recency
Пользователей с самыми низкими значениями R (покупали недавно) получают самый высокий балл. Пользователей с самыми высокими значениями R (покупали давно) получают самый низкий балл.
Для Frequency и Monetary
Пользователи с самыми высокими значениями F и M получают самый высокий балл. Пользователи с самыми низкими значениями получают низкий балл.
💬 Итог шага: у каждого пользователя теперь есть три цифры: R-балл, F-балл, M-балл.
Шаг 3. Группировка пользователей в RFM-сегменты
Самый творческий этап. Объединяем три значения баллов в один RFM-код, затем даём сегменту название.
Способ 1. Конкатенация. Просто склеиваем три цифры. Например, пользователь 3-1-2 попадает в сегмент «312».
Способ 2. Смысловые сегменты (более популярный). Даём сегментам понятные названия на основе комбинаций.
⚠ Пример сегмента RFM-код. Описание:
- «Чемпионы» Код-333. Покупали недавно, часто и много. Лучшие клиенты.
- «Потерянные» Код-111. Давно не покупали, покупали редко и мало.
- «Лояльные» Код-2xx или -3xx. Покупают часто, но не обязательно много.
- «Новые» Код-3xx. Покупали недавно, но пока только один раз (низкая F).
- «На грани ухода» Код-1xx. Давно не покупали, но в прошлом были активны.
- «Заснувшие VIP» Код-133. Давно не было покупок, но в прошлом это были самые ценные клиенты.
⚠ Какие выводы можно сделать на основе такой сегментации?
Это самая важная часть! Цифры сами по себе бесполезны, нужны инсайты и гипотезы.
1. Для сегмента «Чемпионы». Код-333: это ядро продукта, основной источник дохода.
- Действия: удержание, программы лояльности, VIP-обслуживание.
- Монетизация: предлагать товары категории "premium", кросс-селлинг.
- Маркетинг: сделать их амбассадорами бренда (программа рефералов, сбор отзывов).
2. Для сегмента «На грани ухода / Потерянные». Код-1xx, -111: риск полной потери клиента.
- Действия: реактивация, специальные кампании «Мы по вам скучаем!» с агрессивными скидками.
- Опрос: узнать причину ухода.
- Приоритизация: сконцентрироваться на тех, у кого высокий M (бывшие VIP).
3. Для сегмента «Новые клиенты». Код-3xx: потенциальные будущие «Чемпионы», но их нужно удержать.
- Действия: сопровождение в продукт, улучшить процесс адаптации нового пользователя.
- Первая цель: стимулировать вторую покупку, чтобы повысить их F-показатель.
4. Для сегмента «Заснувшие VIP». Код-133, -233: это самые ценные «потерянные» клиенты. Их возврат очень выгоден. Вернуть «бывших» дешевле, чем «купить» новых.
- Действия: персональный подход, не просто массовая рассылка, а персональные письма от менеджера.
- Эксклюзивное предложение: предложить им особые условия для возврата.
5. Общие выводы для продукта и бизнеса:
- Здоровье бизнеса: какой процент клиентов находится в сегментах «Чемпионов» и «Лояльных»? Растет ли он?
- Эффективность маркетинга: откуда приходят самые ценные (с высоким M) клиенты? На какие каналы стоит делать ставку?
- Продуктовые гипотезы: если у «Новых» клиентов низкий процент повторных покупок (не переходят в «Лояльные»), возможно, есть проблема с продуктом или его первым впечатлением.
Резюме для аналитика
- Продуктовый аналитик использует RFM-анализ не как разовую акцию, а как системный инструмент.
- Подготавливает данные и автоматизирует пайплайн расчета RFM-сегментов.
- Визуализирует сегменты (например, в виде диаграммы рассеяния R vs F, или таблицы с долями сегментов).
- Формулирует конкретные гипотезы и рекомендации для маркетинга, отдела продаж и продуктовой команды.
- Оценивает результаты проведенных кампаний, сравнивая RFM-сегменты до и после.