Введение
Иногда данные могут нас обманывать. Мы можем видеть положительную динамику внутри отдельных сегментов, но при объединении результатов получаем неожиданный общий тренд.
Это явление известно как парадокс Симпсона. В этой статье я разберу конкретный случай, связанный со средним чеком на маркетплейсах, и покажу, как изменение структуры данных может исказить восприятие реальности.
Этот случай произошел у одного из клиентов, с которым я работаю. BI-система показала подобные результаты, и многие сначала подумали, что это ошибка в расчетах – казалось, что так не может быть.
Однако я сразу опознал эффект Симпсона. Пришлось потратить время, чтобы объяснить его суть и причины появления. В итоге все поняли, насколько важно учитывать структуру данных, а не только их средние значения.
В общем, многим рекомендую изучить и знать, что такое этотэффект Симпсона – он может встретиться в самых неожиданных местах!
Описание ситуации
В данных за два периода (прошлый и текущий) наблюдается явление, известное как парадокс Симпсона. Оно заключается в том, что средний чек по каждому маркетплейсу либо вырос, либо изменился незначительно, но общий средний чек по всем маркетплейсам снизился.
Данные по среднему чеку
Средний чек рассчитывается по формуле:
Причина падения общего среднего чека
- Количество заказов на WB (самый низкий средний чек) выросло.
- Количество заказов на OZON и Яндекс Маркете (где средний чек выше) сократилось.
- В результате общая структура заказов сместилась в сторону WB, что привело к снижению общего среднего чека.
Графическое подтверждение
График ниже иллюстрирует парадокс.
Он показывает:
- Средний чек по WB немного снизился, но у Яндекс Маркета и OZON он вырос.
- Однако общий средний чек упал, потому что доля WB в заказах увеличилась.
- Это и есть парадокс Симпсона: на уровне отдельных маркетплейсов тренд один, но в общем итоге наблюдается противоположное явление.
Выводы
- Рост заказов на маркетплейсе с низким средним чеком может исказить общие показатели, несмотря на улучшение по отдельным сегментам.
- Анализируя данные, важно смотреть не только на средние значения, но и на структуру данных.
- Этот случай демонстрирует, насколько важно учитывать изменение долей сегментов при анализе финансовых и операционных метрик.
Если потребуется дополнительное пояснение - не стесняйтесь - пишите в личку.