Добавить в корзинуПозвонить
Найти в Дзене
Market Gravity

Корреляция: три скрытых ловушки

Про функцию CORREL, наверное, знают все, чьи знания Excel простираются чуть дальше «ВПР». На первый взгляд все очень просто — значение ближе к единице значит, что связь сильная, ближе к нулю — почти никакой. Звучит красиво, понятно и убедительно? И все же корреляция — это не про истину в последней инстанции, а про сигнал. Функция CORREL нам честно сообщает, что две величины двигаются вместе. Все. Она не говорит, кто кого вызывает. Она не объясняет, что стоит за этим движением. Она просто поднимает бровь и показывает пальцем: «Посмотри-ка сюда». Примерно так можно читать ее значения. Если коэффициент в районе 0–0,2 — почти ничего не происходит. Метрики живут своей жизнью. 0,3–0,4 — слабое шевеление. Можно зафиксировать, но пока без восторга. 0,5–0,6 — уже повод присмотреться. 0,7–0,8 — становится действительно интересно. 0,8 и выше — здесь особенно велико искушение назвать это закономерностью. И вот именно в этот момент нужно быть аккуратнее всего! А теперь выйдем из Excel и зайдем


Про функцию CORREL, наверное, знают все, чьи знания Excel простираются чуть дальше «ВПР». На первый взгляд все очень просто — значение ближе к единице значит, что связь сильная, ближе к нулю — почти никакой. Звучит красиво, понятно и убедительно?

И все же корреляция — это не про истину в последней инстанции, а про сигнал. Функция CORREL нам честно сообщает, что две величины двигаются вместе. Все. Она не говорит, кто кого вызывает. Она не объясняет, что стоит за этим движением. Она просто поднимает бровь и показывает пальцем: «Посмотри-ка сюда».

Примерно так можно читать ее значения.

Если коэффициент в районе 0–0,2 — почти ничего не происходит. Метрики живут своей жизнью.

0,3–0,4 — слабое шевеление. Можно зафиксировать, но пока без восторга.

0,5–0,6 — уже повод присмотреться.

0,7–0,8 — становится действительно интересно.

0,8 и выше — здесь особенно велико искушение назвать это закономерностью.

И вот именно в этот момент нужно быть аккуратнее всего!

А теперь выйдем из Excel и зайдем на наш сайт.

В онлайн-продажах корреляции могут быть куда интереснее, чем кажется на первый взгляд.

Например, глубина просмотра и конверсия.

Интуиция подсказывает: чем больше человек смотрит страниц, тем он заинтересованнее. Значит, должен покупать чаще. Но бывает и так, что корреляция показывает обратное: люди, которые быстро находят нужный товар и оформляют заказ, конвертируются лучше. А те, кто долго ходит по разделам, — сомневаются, сравнивают, откладывают. Это не вывод. Это повод задать вопрос: что именно происходит в поведении пользователя?

Или еще пример — время между первым визитом + покупкой + средний чек.

Иногда те, кто возвращается через день-два, покупают на больший чек, чем те, кто оформляет заказ сразу. Не потому что «дольше думали — больше захотели», а потому что у них изначально была более сложная задача выбора. Такие связи не дают ответа, но они меняют вопросы.

Как и где искать корреляции?

Если вы открываете Excel, чтобы подтвердить, что вы были правы, — лучше вообще его не открывать. Корреляция работает, когда вы готовы удивиться. Ведь самые интересные открытия появляются не между «очевидными» метриками, а между теми, которые обычно не ставят рядом: поведение на сайте и возвраты, скорость выбора и повторные покупки, источник трафика и пожизненная ценность клиента.

Важно смотреть не только в среднем, но и по сегментам.

Корреляция может быть сильной у новых пользователей и исчезать у постоянных.

Может работать только в одном канале трафика.

Может проявляться только в определенные месяцы.

И вот тут начинается настоящая аналитика — когда вы не просто считаете коэффициент, а проверяете, где он живет и при каких условиях исчезает.

А теперь самое интересное: ложные корреляции.

Первая ловушка — третий фактор

Продажи растут, трафик растет, корреляция высокая. Мы радостно делаем вывод: реклама-то работает! А потом открываем вордстат, смотрим сезонность запросов и видим, что просто наступил декабрь, а мы как раз елками торгуем… Продажи и трафик росли не потому, что один вызвал другое, а потому что оба зависели от сезона. Корреляция показала движение, но причина была вне этой пары показателей.

Вторая ловушка — маленькая выборка

Допустим, у вас 20 заказов, а 15 из них пришлись на один источник, — коэффициент может выглядеть впечатляюще. Но это не закономерность. Это совпадение, которому повезло. Релевантная выборка — это не магическое число. Это объем данных, при котором результат не меняется резко при добавлении новой недели или новых клиентов. Если при расширении периода корреляция рассыпается — она была хрупкой.

И, наконец, третья ловушка — массовый поиск совпадений

Если вы проверите сто пар метрик, какие-то из них обязательно «выстрелят». И не потому, что между ними есть глубокая связь, а потому, что статистика любит случайные совпадения.

Корреляция — это очень удобный инструмент, она помогает заметить, где есть движение вместе. Однако она не знает про сезонность, не знает про поведение людей и даже не знает про случайность. Она просто честно показывает: «Вот эти 2 штуки двигаются синхронно». А вот почему — это уже наша/ваша работа.

И, возможно, самая интересная ее часть =)