Модель атрибуции — это правило, по которому ценность конверсии распределяется по разным каналам взаимодействия покупателя с брендом. Это позволяет проанализировать эффективность разных источников и принять решение относительно подключения/отключения того или иного рекламного канала. Тем не менее, несмотря на тщательный анализ, часто это не приводит к нужным результатам. Почему? Выбрана не та модель атрибуции? Тогда как выбрать правильную?
Стандартные модели
По умолчанию Google Analytics предлагает нам использовать несколько моделей: First Click, Last Click, Last Non Direct Click. Со временем появились и дополнительные модели:
- «Линейная» — каждой точке на пути конверсии присваиваются равные доли ценности конверсии (по 25 %).
- «С учетом давности взаимодействий» — самую большую долю ценности получают точки взаимодействия, наиболее близкие по времени к продаже или конверсии.
- «На основе позиции» — по 40 % ценности присваивается первому и последнему взаимодействиям, а оставшиеся 20 % поровну распределяются между остальными.
Однако у всех этих моделей есть свои недостатки. Например, First Click и Last Click учитывают первый и последний канал, в то время как все остальные каналы остаются недооцененными. Атрибуция по уменьшению времени (The Time Decay Model) работает следующим образом: чем ближе канал к итоговой конверсии, тем выше его ценность. Однако и это может быть не совсем правильно, ведь каналы более длинных, но эффективных цепочек будут выглядеть хуже, чем такие же каналы в коротких цепочках. Более того, важность первого или последнего касания зачастую сильно зависит от сферы конкретного бизнеса, и недооценивать их тоже может быть не совсем корректно.
Какие еще могут быть модели атрибуции? Константин Юревич рассказал нам о модели атрибуции, разработанной на основе машинного обучения.
Модели атрибуции на основе Machine Learning
Константин Юревич: Predictive analytics and ML-attribution using BigQuery ML
В рамках платформы SegmentSteam мы построили все возможные атрибуции, которые присутствуют на рынке. Однако у всех этих моделей был ряд проблем:
- Одни не учитывали мультиканальность и множественные касания перед покупкой.
- Другие были неустойчивы к фроду.
- Большинство смотрели только в прошлое и не могли предсказать, как действовать в будущем с новыми кампаниями и маркетинговыми активностями.
Проанализировав достоинства и недостатки каждой модели, мы разработали собственную модель поведенческой атрибуции, основанной на машинном обучении, которая:
- устойчива к фроду;
- использует накопленные знания для улучшения новых кампаний;
- справедливо распределяет ценность конверсии между всеми источниками в цепочке;
- учитывает не только переходы и UTM-метки, но и реальное поведение пользователя на сайте.
В основе модели лежит предсказание, с какой вероятностью будет совершено определенное действие (конверсия) каждым отдельным пользователем в зависимости от его поведения на сайте.
При каждом входе на сайт из нового канала предсказывается вероятность совершения клиентом покупки в начале сессии и в конце сессии. Разница в этих предсказаниях (дельта) определяет пропорцию ценности, которая присваивается каждому источнику, инициировавшему переход на сайт.
Рассмотрим пример, изображенный на картинке выше (цифры вымышленные):
- Пользователь впервые попал на сайт. Мы определяем, что вероятность совершения им покупки на этой стадии 10 %.
- Пользователь провел на сайте какое-то время, совершил какие-то действия и в итоге ушел. Вероятность совершения им покупки в момент ухода с сайта составила 25 %.
- Это означает, что компания Facebook получит 15 %, т. к. во время инициированной ею сессии вероятность конвертироваться изменилась с 10 до 25 % для конкретного пользователя.
- Затем, через 2 дня, пользователь увидел ретаргетинг от Criteo и вернулся на сайт. Проведя на сайте какое-то время, пользователь ушел, а вероятность совершения им покупки увеличилась лишь на 2 %. Поэтому Criteo получит лишь 2 % ценности в цепочке.
Таким образом, мы видим, как каждая рекламная кампания повлияла на вероятность совершения покупки каждым человеком, и можем ювелирно распределить ценность для каждого источника в цепочке.