Предвзятость или отсутствие репрезентативности часто встречается в исследованиях. Обычно это выражается в смещении результатов исследования относительно генеральной совокупности, стоит сказать о том, что «истинная случайность» часто недостижима, но получение хоть каких-то результатов все же лучше, чем ничего. Поэтому многие исследования проводятся на «удобных» выборках, которые легче получить, они, безусловно, имеют ту или иную степень предубежденности. Подобное исследование нужно рассматривать как промежуточное или промежуточное.
Наглядный пример смещения
Давайте возьмем пациентов в определенной больнице в качестве примера. У нас есть 250 пациентов во время эпидемии гриппа. Мы измеряем количество белых кровяных клеток у всех стационарных больных и отдельно у 30 больных в инфекционном отделении (которые непосредственно болеют гриппом). На рис. 1. показано с какой частотой встречается то или иное число белых кровяных телец у пациентов. Белый цвет – для пациентов больницы, черным – отдельно для пациентов из инфекционного отделения.
Очевидно, что выборка, состоящая из 30 пациентов в инфекционном отделении, дала значительное смещение результатов в сторону увеличения частоты встречаемости большего количества белых кровяных телец, по сравнению с результатами всей больницы.
Повышение репрезентативности за счет рандомизации
Попытка обеспечить репрезентативность выборки уже сама по себе является небольшим исследованием. Здесь важно обеспечить случайный выбор выборки (обожаю тавтологию). Случайная выборка – это выборка элементов из генеральной совокупности без каких-то причин, т.е. на принципах случайности. Случайность можно выразить фразой «любой член популяции может быть выбран с такой же вероятностью, как и другой». Выборка не является случайной, если у нас есть какие-либо предварительные размышления или знания о том, какое значение будет иметь элемент. Методы рандомизации мы рассмотрим как-нибудь позже, отметим, что и подбрасывание монеты неплохой вариант.
Источники смещений
Источников множество, и ни один список не может быть полным. Некоторые из наиболее распространенных, на которые следует обратить внимание, мы приведем здесь:
1. Смещение в результате отбора. Для проведения исследований часто набирают добровольцев, и к нам приходят люди, которые так или иначе заинтересованы, а часто это «профессиональные» испытуемые, которые ходят с одного исследования на другое, чтобы заработать.
2. Предвзятость, связанная с принадлежностью к определенным группам. В исследуемую группу включают людей, проживающих в определенном регионе, культуре, среде или имеющих определенный возраст.
3. Смещение из-за отсутствия данных. Иногда случается так, что пациенты выбывают из исследования по какой-либо причине (семейные обстоятельства, состояние здоровья), однако результаты, полученные с участием этих людей, все равно включаются в конечный отчет. Ну не пропадать же добру!
4. Систематическая ошибка состояния здоровья (систематическая ошибка Берксона). Когда два фактора в обычных условиях независимы, но появляется некий третий фактор, и они становятся зависимыми.
5. Систематическая ошибка распространенности-заболеваемости (систематическая ошибка Неймана). Формируют группу, где пациенты с крайними значениями состояния здоровья исключаются, то есть не берем совершенно здоровых и/или совершенно больных.
6. Предвзятость коморбидности. Включены в выборку будут пациенты, у которых есть сопутствующие заболевания, влияющие на их здоровье.
7. Предвзятость отчетности. О некоторых социально неприемлемых заболеваниях не сообщается.