Помню то время, когда в российских научных статьях и диссертациях встречались одни только средние арифметические. «Эм большое плюс-минус эм малое» было стандартным способом описать количественные данные.
Времена меняются, и большинство исследователей сейчас уже знают, что есть альтернативный способ представления количественных показателей - медиана. Несмотря на то, что этот показатель очень просто определяется и имеет вполне конкретный смысл, почему-то до сих пор он вызывает больше вопросов, чем средняя арифметическая. Попробуем дать несколько определений с простыми примерами, которые сделают медиану понятнее и роднее.
Медиана - реальный показатель
- Это значение показателя у конкретного пациента, находящегося посередине упорядоченного по возрастанию ряда (если общее число пациентов нечётное),
- либо среднее арифметическое значений у двух конкретных пациентов, находящихся посередине ряда (если число пациентов чётное).
Например, в ряду из значений возраста 5 пациентов: 43, 45, 48, 52, 56, медиана возраста составит 48 лет - это возраст конкретного пациента №3.
В ряду из значений возраста 6 пациентов: 43, 45, 46, 48, 52, 52, посередине находятся 2 пациента - №3 и №4 - с возрастом 46 и 48 лет. Значит, медиана возраста составит среднее между 46 и 48, то есть 47 лет.
Медиана - показатель структуры
Так как она находится ровно посередине ряда значений, слева и справа от неё находится равное число пациентов. Можно сделать вывод о распределении, структуре данных.
Например, в статье указана медиана возраста пациентов - 50 лет. Это означает, что число пациентов в возрасте до 50 лет и число пациентов в возрасте от 50 и старше - одинаковое. Полезная информация для исследователя и читателя!
Медиана - робастный показатель
Робастностью называют устойчивость к выбросам. Выбросы - это экстремальные значения показателя - очень маленькие или очень большие, которые сильно отличаются от остальных значений в выборке. Наличие даже одного выброса может сильно изменить неробастные показатели, например, среднее арифметическое. А вот значения робастных показателей не изменятся или изменятся незначительно.
Например, в ряду значений возраста:
24, 27, 28, 30, 31, 65,
65 - очевидный выброс, значение, сильно отличающееся от остальных.
Рассчитаем средний возраст С и БЕЗ выброса. Получатся 34.2 и 28. Разница достаточно большая - 6.2 года.
Теперь определим медианы. Получатся 29 и 28, разница всего в 1 год.
Получается, наличие выбросов сильно меняет значение неробастного среднего показателя и мало меняет значение робастной медианы.
Медиана - универсальный показатель
Медиану можно указывать независимо от распределения данных, так как она отвечает на конкретный вопрос: какое значение находится посередине ряда показателей.
Почему при нормальном распределении обычно указывают только среднее арифметическое? Объясняется просто: нормальное распределение обладает симметрией относительно среднего значения. То есть число пациентов со значениями показателя ниже среднего равно числу пациентов с показателем выше среднего. Таким образом, средний показатель становится равен (или почти равен) медиане и дополнительно указывать ее значение не имеет смысла.
Например, ряд значений возраста:
35, 38, 40, 42, 45 - симметричен.
Средний возраст составляет 40 лет. И медиана тоже равна 40. Поэтому достаточно указать только среднее значение.
Ну а в случае «ненормального» распределения, которое чаще всего (но необязательно!) является асимметричным, среднее значение становится малоинформативным, и мы указываем только медиану, которая в отличие от среднего значения, своей ценности не теряет и также продолжает указывать середину ряда значений.
👉 Например, ряд значений возраста:
37, 38, 40, 48, 50 - асимметричен.
Средний возраст равен 42.6, а медиана - 40. В данном случае мы укажем медиану, чтобы показать середину ряда значений.
Медиана целочисленных показателей может быть только либо целым числом, либо иметь дробную часть - .5
Это следует из того, что медиана - либо значение показателя у конкретного пациента, либо среднее значение двух пациентов. Если показатель выражается целыми значениями, например, возраст взрослых людей, артериальное давление, оценка боли по ВАШ, длительность лечения в койко-днях и т.д., то таких дробных значений медианы, как 11.3, 24.9, 4.7 - быть не может.
Вот такой интересный и полезный показатель - медиана. Используйте и интерпретируйте её правильно как в своей научной работе, так и при чтении медицинских статей.