Найти тему
Галина Дейнекина

Применение среднего арифметического и медианы при анализе данных

Сегодня разберем два понятия «среднее арифметическое» и «медиана».

Для начала задам два вопроса: знакомы ли вы с понятием «медиана»? Знаете ли вы, в чем разница между средним арифметическим и медианой? Скорее всего, если вы работаете с обзорами по рынку зарплат, вы встречали понятие медианы и чаще всего именно на этом ее применение и заканчивалось. Но я рекомендую использовать медиану и в других случаях.

Среднее арифметическое – это самый популярный статистический показатель, который используется для измерения центра или середины данных. Для сокращения далее будут упоминать "среднее значение". Среднее значение считается как сумма всех чисел, деленная на общее количество чисел. Это материал где-то пятого класса, поэтому тут пока все просто. Среднее значение в компаниях считают для стажа, возраста сотрудников, зарплаты по грейду, уровню должности, для подачи отчетности по статистическим данным. Считается с помощью функции в Excel: СРЗНАЧ или AVERAGE в английской версии.

-2

Минусы среднего значения:

Среднее значение может быть не совсем объективным отражением данных, так как на него могут влиять выбросы (очень большие или очень маленькие значения в наборе данных).

Если вы считаете средний стаж работы сотрудников в компании при большой текучести, стаж до трех месяцев работы сотрудников будет занижать данные. Или наоборот, у вас есть сотрудники-старожилы, которые работают с основания компании. При учете их продолжительности стажа вы будете завышать данные, что тоже искажает отчетность.

Пример: рассчитать средний стаж работы сотрудников.

-3

Средний стаж составит 4 года.

Медиана – значение, которое делит отсортированные по возрастанию данных на две равные части. То есть медиана показывает середину ваших данных. Медиана определяет значение, расположенное по середине ряда отсортированных значений. Если в ряду находится нечетное количество данных, например, 5, то медианой будет третье значение. Если четное количество данных, например, 4, то медианой будет (значение 2+ значение 3)/2. То есть среднее значение двух показателей посередине.

Считается с помощью функции в Excel МЕДИАНА или MEDIAN в английской версии. Медиана лишена недостатков среднего значения, на нее не влияют выбросы.

-4

Пример:

-5

Медиана стажа составит 3 года. Разница между 3 и 4 годами стажа работы все-таки есть.

РЕКОМЕНДАЦИЯ: если нужно посчитать стаж, возраст, зарплату, считайте не среднее арифметическое, а медиану. Ну или убирайте выбросы. Как? Читайте в этой статье: "Как расчет среднего может навредить"

Если вы хотите понять, как знания статистики могут помочь в вашей работе, приглашаю на онлайн-курс "HR-статистика".