Найти в Дзене
CoMagic

Как работают модели атрибуции на основе Machine Learning

Оглавление

Модель атрибуции — это правило, по которому ценность конверсии распределяется по разным каналам взаимодействия покупателя с брендом. Это позволяет проанализировать эффективность разных источников и принять решение относительно подключения/отключения того или иного рекламного канала. Тем не менее, несмотря на тщательный анализ, часто это не приводит к нужным результатам. Почему? Выбрана не та модель атрибуции? Тогда как выбрать правильную?

Стандартные модели

По умолчанию Google Analytics предлагает нам использовать несколько моделей: First Click, Last Click, Last Non Direct Click. Со временем появились и дополнительные модели:

  • «Линейная» — каждой точке на пути конверсии присваиваются равные доли ценности конверсии (по 25 %).
  • «С учетом давности взаимодействий» — самую большую долю ценности получают точки взаимодействия, наиболее близкие по времени к продаже или конверсии.
  • «На основе позиции» — по 40 % ценности присваивается первому и последнему взаимодействиям, а оставшиеся 20 % поровну распределяются между остальными.

Однако у всех этих моделей есть свои недостатки. Например, First Click и Last Click учитывают первый и последний канал, в то время как все остальные каналы остаются недооцененными. Атрибуция по уменьшению времени (The Time Decay Model) работает следующим образом: чем ближе канал к итоговой конверсии, тем выше его ценность. Однако и это может быть не совсем правильно, ведь каналы более длинных, но эффективных цепочек будут выглядеть хуже, чем такие же каналы в коротких цепочках. Более того, важность первого или последнего касания зачастую сильно зависит от сферы конкретного бизнеса, и недооценивать их тоже может быть не совсем корректно.

Какие еще могут быть модели атрибуции? Константин Юревич рассказал нам о модели атрибуции, разработанной на основе машинного обучения.

Модели атрибуции на основе Machine Learning

Константин Юревич: Predictive analytics and ML-attribution using BigQuery ML

В рамках платформы SegmentSteam мы построили все возможные атрибуции, которые присутствуют на рынке. Однако у всех этих моделей был ряд проблем:

  • Одни не учитывали мультиканальность и множественные касания перед покупкой.
  • Другие были неустойчивы к фроду.
  • Большинство смотрели только в прошлое и не могли предсказать, как действовать в будущем с новыми кампаниями и маркетинговыми активностями.

Проанализировав достоинства и недостатки каждой модели, мы разработали собственную модель поведенческой атрибуции, основанной на машинном обучении, которая:

  1. устойчива к фроду;
  2. использует накопленные знания для улучшения новых кампаний;
  3. справедливо распределяет ценность конверсии между всеми источниками в цепочке;
  4. учитывает не только переходы и UTM-метки, но и реальное поведение пользователя на сайте.

В основе модели лежит предсказание, с какой вероятностью будет совершено определенное действие (конверсия) каждым отдельным пользователем в зависимости от его поведения на сайте.

При каждом входе на сайт из нового канала предсказывается вероятность совершения клиентом покупки в начале сессии и в конце сессии. Разница в этих предсказаниях (дельта) определяет пропорцию ценности, которая присваивается каждому источнику, инициировавшему переход на сайт.

-2

Рассмотрим пример, изображенный на картинке выше (цифры вымышленные):

  1. Пользователь впервые попал на сайт. Мы определяем, что вероятность совершения им покупки на этой стадии 10 %.
  2. Пользователь провел на сайте какое-то время, совершил какие-то действия и в итоге ушел. Вероятность совершения им покупки в момент ухода с сайта составила 25 %.
  3. Это означает, что компания Facebook получит 15 %, т. к. во время инициированной ею сессии вероятность конвертироваться изменилась с 10 до 25 % для конкретного пользователя.
  4. Затем, через 2 дня, пользователь увидел ретаргетинг от Criteo и вернулся на сайт. Проведя на сайте какое-то время, пользователь ушел, а вероятность совершения им покупки увеличилась лишь на 2 %. Поэтому Criteo получит лишь 2 % ценности в цепочке.

Таким образом, мы видим, как каждая рекламная кампания повлияла на вероятность совершения покупки каждым человеком, и можем ювелирно распределить ценность для каждого источника в цепочке.