Найти в Дзене

Что такое медиана?

Помню то время, когда в российских научных статьях и диссертациях встречались одни только средние арифметические. «Эм большое плюс-минус эм малое» было стандартным способом описать количественные данные.

Времена меняются, и большинство исследователей сейчас уже знают, что есть альтернативный способ представления количественных показателей - медиана. Несмотря на то, что этот показатель очень просто определяется и имеет вполне конкретный смысл, почему-то до сих пор он вызывает больше вопросов, чем средняя арифметическая. Попробуем дать несколько определений с простыми примерами, которые сделают медиану понятнее и роднее.

Медиана - реальный показатель

  • Это значение показателя у конкретного пациента, находящегося посередине упорядоченного по возрастанию ряда (если общее число пациентов нечётное),
  • либо среднее арифметическое значений у двух конкретных пациентов, находящихся посередине ряда (если число пациентов чётное).

Например, в ряду из значений возраста 5 пациентов: 43, 45, 48, 52, 56, медиана возраста составит 48 лет - это возраст конкретного пациента №3.

В ряду из значений возраста 6 пациентов: 43, 45, 46, 48, 52, 52, посередине находятся 2 пациента - №3 и №4 - с возрастом 46 и 48 лет. Значит, медиана возраста составит среднее между 46 и 48, то есть 47 лет.

Медиана - показатель структуры

Так как она находится ровно посередине ряда значений, слева и справа от неё находится равное число пациентов. Можно сделать вывод о распределении, структуре данных.

Например, в статье указана медиана возраста пациентов - 50 лет. Это означает, что число пациентов в возрасте до 50 лет и число пациентов в возрасте от 50 и старше - одинаковое. Полезная информация для исследователя и читателя!

Медиана - робастный показатель

Робастностью называют устойчивость к выбросам. Выбросы - это экстремальные значения показателя - очень маленькие или очень большие, которые сильно отличаются от остальных значений в выборке. Наличие даже одного выброса может сильно изменить неробастные показатели, например, среднее арифметическое. А вот значения робастных показателей не изменятся или изменятся незначительно.

Например, в ряду значений возраста:

24, 27, 28, 30, 31, 65,

65 - очевидный выброс, значение, сильно отличающееся от остальных.

Рассчитаем средний возраст С и БЕЗ выброса. Получатся 34.2 и 28. Разница достаточно большая - 6.2 года.

Теперь определим медианы. Получатся 29 и 28, разница всего в 1 год.

Получается, наличие выбросов сильно меняет значение неробастного среднего показателя и мало меняет значение робастной медианы.

Медиана - универсальный показатель

Медиану можно указывать независимо от распределения данных, так как она отвечает на конкретный вопрос: какое значение находится посередине ряда показателей.

Почему при нормальном распределении обычно указывают только среднее арифметическое? Объясняется просто: нормальное распределение обладает симметрией относительно среднего значения. То есть число пациентов со значениями показателя ниже среднего равно числу пациентов с показателем выше среднего. Таким образом, средний показатель становится равен (или почти равен) медиане и дополнительно указывать ее значение не имеет смысла.

Например, ряд значений возраста:

35, 38, 40, 42, 45 - симметричен.

Средний возраст составляет 40 лет. И медиана тоже равна 40. Поэтому достаточно указать только среднее значение.

Ну а в случае «ненормального» распределения, которое чаще всего (но необязательно!) является асимметричным, среднее значение становится малоинформативным, и мы указываем только медиану, которая в отличие от среднего значения, своей ценности не теряет и также продолжает указывать середину ряда значений.

👉 Например, ряд значений возраста:

37, 38, 40, 48, 50 - асимметричен.

Средний возраст равен 42.6, а медиана - 40. В данном случае мы укажем медиану, чтобы показать середину ряда значений.

Медиана целочисленных показателей может быть только либо целым числом, либо иметь дробную часть - .5

Это следует из того, что медиана - либо значение показателя у конкретного пациента, либо среднее значение двух пациентов. Если показатель выражается целыми значениями, например, возраст взрослых людей, артериальное давление, оценка боли по ВАШ, длительность лечения в койко-днях и т.д., то таких дробных значений медианы, как 11.3, 24.9, 4.7 - быть не может.

Вот такой интересный и полезный показатель - медиана. Используйте и интерпретируйте её правильно как в своей научной работе, так и при чтении медицинских статей.