Найти в Дзене

Парадокс Симпсона в анализе среднего чека на маркет-плейсах

Оглавление

Введение

Иногда данные могут нас обманывать. Мы можем видеть положительную динамику внутри отдельных сегментов, но при объединении результатов получаем неожиданный общий тренд.

Это явление известно как парадокс Симпсона. В этой статье я разберу конкретный случай, связанный со средним чеком на маркетплейсах, и покажу, как изменение структуры данных может исказить восприятие реальности.

Этот случай произошел у одного из клиентов, с которым я работаю. BI-система показала подобные результаты, и многие сначала подумали, что это ошибка в расчетах – казалось, что так не может быть.

Однако я сразу опознал эффект Симпсона. Пришлось потратить время, чтобы объяснить его суть и причины появления. В итоге все поняли, насколько важно учитывать структуру данных, а не только их средние значения.

В общем, многим рекомендую изучить и знать, что такое этотэффект Симпсона – он может встретиться в самых неожиданных местах!

Описание ситуации

В данных за два периода (прошлый и текущий) наблюдается явление, известное как парадокс Симпсона. Оно заключается в том, что средний чек по каждому маркетплейсу либо вырос, либо изменился незначительно, но общий средний чек по всем маркетплейсам снизился.

Данные по среднему чеку

Средний чек рассчитывается по формуле:

-2

Причина падения общего среднего чека

  • Количество заказов на WB (самый низкий средний чек) выросло.
  • Количество заказов на OZON и Яндекс Маркете (где средний чек выше) сократилось.
  • В результате общая структура заказов сместилась в сторону WB, что привело к снижению общего среднего чека.

Графическое подтверждение

График ниже иллюстрирует парадокс.

-3

Он показывает:

  • Средний чек по WB немного снизился, но у Яндекс Маркета и OZON он вырос.
  • Однако общий средний чек упал, потому что доля WB в заказах увеличилась.
  • Это и есть парадокс Симпсона: на уровне отдельных маркетплейсов тренд один, но в общем итоге наблюдается противоположное явление.

Выводы

  • Рост заказов на маркетплейсе с низким средним чеком может исказить общие показатели, несмотря на улучшение по отдельным сегментам.
  • Анализируя данные, важно смотреть не только на средние значения, но и на структуру данных.
  • Этот случай демонстрирует, насколько важно учитывать изменение долей сегментов при анализе финансовых и операционных метрик.

Если потребуется дополнительное пояснение - не стесняйтесь - пишите в личку.