Добавить в корзинуПозвонить
Найти в Дзене
Brainsburg Educational

Как анализировать продажи? Частота. Сортировка. Мода. Медиана.

Владелец кофейни хочет понять — какой сироп заказывать чаще
всего. Опросить всех жителей города невозможно — это слишком дорого и
долго. Поэтому в субботу были опрошены 50 случайных посетителей кофейни. В нашем примере все жители города — это генеральная совокупность, то есть — все объекты, о которых хотят сделать вывод. А 50 случайных посетителей — это выборка, то есть — часть генеральной совокупности, на основе которой делают выводы. Но всё должно быть по честноку, поэтому главное условие выборки: опрашивать строго случайных людей, а не только друзей или постоянных гостей. Так вот допустим, что каждый посетитель назвал любимый сироп. Закодируем ответы числами для удобства счёта: Таким образом получилось, что исходные данные — это набор из ответов наших 50 посетителей: Чтобы понять спрос, нужно: Частота повторений показывает, сколько раз каждый сироп встретился в
выборке. Посчитав какой код как часто встречается, мы можем заполнить
следующую таблицу: Сумма частот: 13раз + 24раза +
Оглавление

Владелец кофейни хочет понять — какой сироп заказывать чаще
всего. Опросить всех жителей города невозможно — это слишком дорого и
долго. Поэтому в субботу были опрошены 50 случайных посетителей кофейни.

В нашем примере все жители города — это генеральная совокупность, то есть — все объекты, о которых хотят сделать вывод.
А 50 случайных посетителей — это выборка, то есть — часть генеральной совокупности, на основе которой делают выводы.

Но всё должно быть по честноку, поэтому главное условие выборки: опрашивать строго случайных людей, а не только друзей или постоянных гостей.

Так вот допустим, что каждый посетитель назвал любимый сироп. Закодируем ответы числами для удобства счёта:

  1. Ваниль
  2. Карамель
  3. Лесной орех
  4. Кокос
  5. Мята

Таким образом получилось, что исходные данные — это набор из ответов наших 50 посетителей:

-2

Чтобы понять спрос, нужно:

  • посчитать, как часто встречается каждый сироп;
  • найти самый популярный (модный);
  • определить, какой сироп делит все предпочтения ровно пополам;
  • исследовать распределение спроса (найти все квантили и сделать выводы).

Шаг 1. Частота повторений

Частота повторений показывает, сколько раз каждый сироп встретился в
выборке. Посчитав какой код как часто встречается, мы можем заполнить
следующую таблицу:

-3

Сумма частот: 13раз + 24раза + 7раз + 3раза + 3раза = 50 ✓

Шаг 2. Упорядоченная выборка

Прежде чем искать моду и медиану — сортируем данные по возрастанию. Без сортировки нельзя определять ни медиану, ни квартили, ни перцентили, потому что все они зависят от места элемента в упорядоченной выборке. Перепишем ту же самую переменную opros:

-4

Шаг 3. Мода (модный элемент)

Мода — значение, которое встречается чаще других. Смотрим на частоты: код 2, то есть сироп «Карамель», встретился 24 раза — больше всех остальных. Следовательно Мода = 2 (Карамель).

Шаг 4. Медиана

Это центральное значение упорядоченной выборки. Формула зависит от количества элементов n:

Если n нечётное, то берём среднее двух центральных элементов:

-5

Если n чётное, то берём среднее двух центральных элементов:

-6

В нашем случае n = 50 — число чётное, поэтому нет единственного
центрального элемента, а есть два: 25-й и 26-й. Используем вторую
формулу:

-7

или

-8

25-й и 26-й элементы у нашей упорядоченной выборки это 2 и 2. Поэтому m=(2+2)/2=2 и мы получаем, что медиана = 2 (Карамель).

Должны ли мода и медиана совпадать? НЕТ! Это лишь случайность!

ВЫВОД

Мода и медиана совпали и равны 2 (сиропу «Карамель»). Это
значит, что карамель не только выбирают чаще всего, но она делит все
предпочтения ровно пополам:

  • первая половина посетителей предпочитает карамель и более лёгкие вкусы,
  • вторая половина предпочитают карамель и более насыщенные.

Владельцу кофейни стоит держать карамельный сироп в приоритете при формировании заказа.