Две мои предыдущие статьи, посвященные критическому взгляду на вакцинацию от коронавируса, прочитало и прокомментировало довольно много пользователей Яндекс-Дзена (тысячи и сотни соответственно). Самая чувствительная для меня критика прозвучала от тех людей, которые сами пытались искать объективные статистические данные об эффективности вакцинации и сами не хотят никому верить на слово, а ставят вопрос жестко: "Вы называете себя специалистом по статистике? Так вот Вам данные, которые Вы запросили. Анализируйте их. Посмотрим, какие выводы Вы сделаете."
Пользователь по имени Данила прислал вот такую достаточно полную таблицу (благодарю Данилу):
Правда, это оказались британские данные (российские, очевидно, так никто и не нашел, увы). Ну что же, давайте попробуем разобраться в британских. Хотя цифры у нас в РФ будут точно иными, но логика анализа таких добротно структурированных данных будет весьма ПОКАЗАТЕЛЬНОЙ и некоторые субъективные ошибки крайних сторонников и крайних противников вакцинации мы здесь обязательно высветим. Ибо, как я и ожидал, реальные данные опровергают всякую крайнюю точку зрения.
КАК УСТРОЕНА ТАБЛИЦА?
Уважаемые читатели и коллеги! Прошу Вас проверить, если Вы можете, корректно ли я произвел упрощающую трансформацию таблицы. При этом для упрощения числа были округлены до целого, я также отбросил крайние возрастные интервалы. Пришлось руками переписывать данные в электронную таблицу Эксель из графического образа (чтобы автоматизировать расчеты коэффициентов). Поэтому, увы, поспешная такая работа могла привести к ошибкам. Сообщите, если заметите, пожалуйста. Приму с благодарностью Ваши поправки и внесу их в таблицу.
Конечно, контраст между цифрами частоты случаев по вакцинированным и невакцинированным заметен на глазок. Хотя не сразу понятно, что этот контраст работает в пользу вакцинированных. Да, работает! Например, число зараженных среди вакциированных во всех возрастных группах больше, но при этом надо обязательно НЕ забывать, что в популяции группы вакцинированных и невакцинированных НЕ равны по численности: вакцинированных в Соединенном Королевстве гораздо больше (как я уже писал не раз в прошлых публикациях). Поэтому сравнивать надо доли, а не "голые цифры" (то есть относительные частоты событий, а не абсолютные). Впрочем, в правых колонках, где пошла информация о соотношении долей среди госпитализированных и умерших даже абсолютные цифры говорят в пользу положительного эффекта вакцинации.
РАНО РАДОВАТЬСЯ
Но... стоп! Рано нашим "ваксерам" (сторонникам тотальной вакцинации) радоваться. Давайте спокойно проанализируем, а какой силы этот эффект, обладает ли он статистической значимостью, воспринимается ли он людьми на уровне "психологических механизмов интуитивного вероятностного отражения". Многие математики-специалисты, которые умеют работать с теорией вероятности, даже не подозревают, что существует иная - не научная, а так называемая "наивная теория вероятности", которой интуитивно руководствуется в своей практической жизни каждый человек (хочет или не хочет, но приходится). В психологической науке (не путать с прикладной психотерапией) эта проблематика получала название "вероятностное отражение". Математикам (и другим специалистам в точных науках) кажется, как правило, что вся эта "наивная теория" сплошь состоит из одних ошибок и заблуждений и изучать ее НЕТ СМЫСЛА (!). Но.. психологи - это как раз такой народ, который понимает, что люди в большинстве ситуаций вырабатывает свой взгляд на ситуацию, высказывают свое отношение и принимают решения НЕ на основе научной теории вероятности, а как раз на основе своей собственной "наивной теории" и...становятся заложниками всех тех ошибок, которые подстерегают людей в таком случае...
ПРИМИТИВНЫЙ АНАЛИЗ ПРОЦЕНТОВ (псевдо-анализ)
Что под силу увидеть в указанной выше таблице подавляющему большинству наших сограждан? - Они умеют в лучшем случае подсчитать одну или две дроби, подставив в числитель одно число, в знаменатель - другое и результат умножить на 100, то есть получить некую оценку вероятности, выраженную в процентах. Назовем такой подход "анализом процентов" или "процентным анализом".
К чему приводит такой примитивный подход? - К ошибкам и заблуждениям, о которых я уже много раз писал. Люди невольно стараются так сформировать числитель и знаменатель, чтобы получить результат, который подтверждает их ожидания - льет воду на мельницу уже сформированных убеждений. Что делают противники вакцинации ("антиваксеры") с такими данными, как в указанной таблице? - Они, например, берут за 100 процентов общее число зараженных (1023 плюс 887) и это у них оказывается знаменатель дроби. А в числитель они ставят число вакцинированных среди всех зараженных (это 1023). Получается следующий процент 54% (округляю процент до целого). C чем бы это сравнить? - А ну да! Давайте сравним с аналогичным процентом для тех, кто не вакцинирован. Понятно, что для невакцинированных число можно посчитать будто бы так: 100%-54% = 46%. Дальше делается такой абсолютно неправильный вывод: вакцинированные заражаются чаще, то есть вакцинация увеличивает число зараженных в стране (!).
Ниже мы попытаемся понять, где тут ошибка кроется - в такой логике работы с данными. А вначале применим эту же логику для того, чтобы смоделировать, как именно рассуждают ажитированные сторонники вакцинации ("ваксеры"). В качестве числителя ваксеры берут тоже самое число вакцинированных среди зараженных (это 1023), но при этом берут совершенно другой знаменатель. Они берут за 100 процентов общее число людей в генеральной совокупности (в популяции), Поскольку в таблице написано, что в этой совокупности в данном случае 100 тысяч человек, то в знаменатель подставляется число 100 тысяч. Разумеется, что при таком знаменателе вероятность заразиться оказывается равна чуть более 1%, а надежность вакцины оценивается (только не смейтесь, если Вы уже поняли, что это идиотизм) - как 100% - 1% = 99%. Так грубо? Неужели? - возразите вы. Ну нет, иной раз более интеллектуальные ваксеры действуют не так грубо, но все равно по-идиотски. Они берут процент вакцинированных по стране и вычисляют, сколько вакцинированных в каждых 100 тысячах населения: 100 000 * 0,72 = 72 тысячи. Вот это число и идет в знаменатель. Тогда вероятность заражения для вакцинированных получается по формуле: 1023 / 72 000 = примерно 1.41% процентов. Они даже учитывает, что за полгода заразится примерно в 6 раз больше, чем за один месяц. Поэтому 1.4*6 = 8.4% Тогда надежность вакцины выглядит уже немножко скромнее = 91.6%.
Вполне естественно, что каждая из сторон, которая таким глупым образом рассчитывает проценты (по-разному!) никогда не может согласиться с другой стороной. И ваксеры, и антиваксеры оказываются "вооруженными" совершенно разными цифрами, хотя в основе была одна и та же таблица данных (?!).
АНАЛИЗ ТАБЛИЦ СОПРЯЖЕННОСТИ ВМЕСТО ПРИМИТИВНОГО АНАЛИЗ ПРОЦЕНТОВ
В чем же кроется ошибка в логике рассуждения и тех, и других - и ваксеров, и антиваксеров? Чтобы увидеть эту ошибку надо обязательно рассмотреть не 2 числа, а четыре числа, соответствующих не двум, а четырем случаям. Таким образом, возникает четырехклеточная таблица сопряженности (ЧТС). Что это? - Это комбинаторика 2 на 2 - при комбинации двух признаков, которые имеют два качественных значения (бинарные признаки), всегда возникают не 2 случая (события), а четыре случая, и... мы ОБЯЗАНЫ рассматривать все четыре случая как ЦЕЛОСТНУЮ СИСТЕМУ случаев - вместе, а не по отдельности друг от друга (как систему из солнца и нескольких планет, чтобы создать научную карту звездного неба и звездной механики). Давайте построим такую простейшую таблицу и разберемся, как с ее помощью правильно рассчитывать вероятности.
Что же мы видим в этой таблице сопряженности "2 на 2"? Давайте, чтобы Вам было проще сориентироваться в ней, вначале найдем в этой таблице те числа, которые нам уже были знакомы по предыдущему "примитивному анализу процентов". Желтым фоном выделен квадратик с числом 1023 - это наш числитель. Голубоватым фоном выделены 2 разных знаменателя: ваксеры берут для знаменателя сумму по первому столбцу (72 000), а антиваксеры - совсем другую сумму по первой строке (10778). И оба не хотят даже вникнуть, как правило, что именно делает ИНАЧЕ другая сторона. Когда же мы имеем полную таблицу из 4-х случаев, то видим, что суммы по строкам и столбцам - это совершенно разные по смыслу и значению величины. Одно дело - общее число вакцинированных, совсем другое - общее число зараженных.
Но... это только начало. Самое главное, что мы находим в ЧТС и что не видели в самой исходной таблицы никак раньше - это числа в двух нижних клетках ЧТС. Это число незараженных среди вакцинированных (70997) и незараженных среди невакцинированных (27 113). Я смог эти числа вычислить косвенно, пользуясь известной информацией о том, что базовое множество - это 100 000 населения (сто тысяч), а доля вакцинированных в нем составляет 72%.
Получение полной таблицы "2 на 2" дает нам возможность одинаковым образом провести расчет вероятности заражения и для вакцинированных, и для невакцинированных. Первый расчет мы уже произвели раньше и получили 8.4% - вероятность заражения среди вакцинированных за полгода. А среди невакцинированных аналогичный расчет по второму столбцу приводит нас к значению 19.6% (для этого надо было просто поделить 888 на 28 000 и умножить на 100).
Что же получается? Прирост вероятности заболеть в случае отказа от вакцинации составляет на самом деле около 10% (это завышенная оценка, так как шестикратное суммирование добавочной вероятности - не правильная операция с учетом пика второй волны). Если АНТИваксеры при этом будут применять тот же самый показатель для вычисления "надежности отказа от вакцинации", какой применяют ваксеры для оценки положительного эффекта вакцинации, то у них получается значения...ха-ха-ха... немногим меньше, чем 0,90.
"Что за бред? Что Вы несете? У Вас ошибка?" - предвижу такие в этот момент возмущенные голоса. Почему предвижу? - Да я их уже слышал много раз во время преподавания этого особого предмета - анализ таблиц сопряженности. Коллеги, тому, кто из Вас любознательный и неугомонный, я даю в приложении несколько ссылок на разные доступные в Инете страницы с рассказом про то, сколько много РАЗНЫХ показателей созданы для анализа ЧТС и среди них существуют и эти два, по которым мы получили очень близкие значения 0,92 и 0,81 для таких казалось бы совершенно противоположных решений, для альтернативных стратегий поведения как "согласие на прививку" и "отказ от прививки". Почему же у нас возник этот парадокс?
ВНИМАНИЕ! ОТВЕТ: все дело в том, что само заражение - это все-таки редкое событие (!). В таблице возникает резкая асимметрия (неравенство) значений) - в частотах событий между строками. А мы (наша неправильная "наивная теория вероятности") эту асимметрию, как правило, не умеем никак учитывать и делать правильные математические поправки. Для нас - обычных людей - естественным (но неправильным!) способом структурировать свои ожидания в ситуации неопределенности является стратегия, основанная на "фифти-фифти". Мы невольно и подсознательно ожидаем, что одно из двух альтернативных событий должно происходить с вероятностью 0,5 (или пятьдесят процентов), а другое - тоже с вероятностью 0,5 (так что в сумме они дают единицу). Вот здесь и скрывается корень зла! Ваксеры невольно думают (не работая осознанно с числами, но с ощущениями), что прививка дает добавку к вероятности "счастливого избавления от ковида" в размере 0,9 - 0,5 = 0,4 (То есть в размере 40 процентов, что очень и очень прилично). Но... на самом-то деле мы видим по таблице, которую вовсе не я выдумал, но мне прислали, что это значение равно... только лишь 3 процента (!) И тут же у антиваксеров возникает вполне законный вопрос: а стоит ли ради этих трех процентов "огород городить"? Ну уж точно не надо правительству нарываться на социальный конфликт, вводя санкции против тех, кто отказался от этих 3 процентов. Вот если бы чума уносила примерно половину граждан, как это было в старину, вот тогда... все действия по принуждению были бы вынужденными и оправданными, и население беспрекословно построилось бы в шеренги и колонны для их соблюдения. А так - не те, совсем не те вероятности для неприятностей.
ЕЩЕ И КЭФ ВГОНЯЕТ ВСЕХ В ЗАБЛУЖДЕНИЕ (!)
Закругляя здесь общий разговор про ЧТС-подход (более сложные термины и формулы я увожу для любознательных в приложение), я подчеркну, что люди НЕПРАВИЛЬНО реконструируют невидимую для них нижнюю строку в ЧТС. В их подразумеваемой, неявной субъективной модели такой таблички 2 на 2 в нижние клеточки записываются такие значения, которые приводят к равенству сумм по строкам (?!). Это является следствием ошибочного ожидания, что заражение происходит с вероятностью 0,5.
Но... я тут должен завершить разговор о вычислениях, посчитав известный коэффициент эффективности вакцины (КЭВ), который я уже обсуждал ранее в связи со статьей в журнале Ланцет про Спутник.
Для вычисления КЭВ они (разработчики вакцин) делят долю заболевших в группе вакцины на долю заболевших в группе плацебо, вычитают результат из единицы и умножают на 100 процентов.
Э = (1 — (кейсы вакцина) / (всего вакцинированных) / (кейсы плацебо) / (всего плацебо)) × 100% "
А где же тут группа плацебо (получившая псевдо-укол)? - Спросите Вы. Но ведь в разгар эпидемии крайне трудно уговорить массу людей участвовать в эксперименте, где колют физраствор (бесполезный для конкретного человека). Увы, тут нет никакой группы плацебо, поэтому нередко, имея такие данные, которые указаны в таблице, специалисты не особенно себя утруждают поправками, берут вместо группы плацебо данные по группе невакцинированных и грубо считают КЭВ таким образом (подставляем значения из нашей таблицы):
КЭВ = ((1 – ( 1022/72000 ) / (888/28000)) * 100% = (1 – 0,033/0,196) = 1 - 0,83 = 0,17.
"Уфф! - отпыхиваются "эпидемиологи". - Ну это мало, конечно, но все-таки побольше, чем добавочная вероятность 0,02".
Дорогой читатель! - наверное вам ваша интуиция подсказывает, что такой способ расчета КЭВ, который я здесь привел. - Это "чистая химия" (в плохом смысле этого слова - от глагола "химичить"), а полученный результат никакого отношения к теории вероятности вообще не имеет (!). В том смысле, что 0,17 - это не есть оценка вероятности какого-либо события. Многие забывают (не знают вовсе), что не всегда процентный показатель нам говорит про вероятность. Например, 20 этаж в доме из 25 этажей возвышается над землей на 80 процентов от возможного максимума. Так что процентный показатель во многих количественных системах просто указывает "долю от максимума", но никак не вероятность.
ПСИХОЛОГИКА АНТИВАКСЕРОВ МОЖЕТ ТОЖЕ БЫТЬ АДАПТИВНОЙ (!)
Что такое психологика в отличие от логики? - Она также отличается от научной логики, как наивная теория вероятности отличается от научной теории вероятности. Ведь как рассуждают антиваксеры? Почему именно им я тут хочу уделить больше внимания, чем ваксерам? По ряду причин. Во-первых, меня считают "антиваксером", раз я уже полгода критикую политику принудительной вакцинации. Хотя на самом деле я критикую сторонников и того, и другого крайнего полюса - за их ошибки в логике рассуждений и в работе с данными. Во-вторых, именно эту логику властям очень трудно понять, но необходимо, чтобы вернуться к политике социального мира - мирного управления конфликтом. Ведь реальные данные, которые мы с Вами сегодня анализировали не дают никаких оснований считать вакцинацию панацеей, Да, она помогает, но лишь с небольшой вероятностью (!). Только и всего!
Антиваксеры, по моим наблюдениям, не есть однородная группа, а делятся, как минимум, на две такие категории:
а) Люди среднего возраста с отличным здоровьем. Они ведут здоровый и активный образ жизни, крайне мало болеют простудными заболеваниями, ценят собственный природный иммунитет и не хотят подвергать его никакому дополнительному риску ради ... "каких-то трех процентов". Их окружают, как правило, такие же люди - те, кто вместе с ними регулярно активно отдыхает на природе больше, чем предается нездоровому застолью и т.п. "Какой для меня смысл, - рассуждает такой гиперздоровый антиваксер, - что-то впускать в свой здоровый организм, когда я уверен. что этот редкий и вовсе нетяжелый вирус я перенесу легко, почти бессимптомно - как уже перенесли некоторые мои такие же здоровые и сильные друзья. Для меня все это "ковидобесие" - это игра ненасытных бизнесменов, которые просто распиливают бюджет теперь по-новому, а для оправдания больших госзакупок вакцины им нужна паника". Эти люди из подгруппы А концентрируют свое внимание в своей критике на "обогащении производителей вакцины", на "угрозах их малому бизнесу" и так далее. Они нередко заявляют так: "Ковид - это вообще информационный миф, это выдуманная угроза". Оказывается в их непосредственном окружении действительно мало кто тяжело заболел и число смертельных случаев - вообще ноль (!).
б) Люди с очень плохим здоровьем, отягощенные хроническими заболеваниями, ипохондричные, возрастные. Они боятся (не без оснований), что любое возможное (по опыту знакомых) послепрививочное осложнение их организм просто НЕ выдержит. Зачем им эти "три процента", когда они оценивают вероятность умереть от других болезней с вероятностью в тридцать и даже пятьдесят процентов (!). Они через день хватаются за сердце и спасают нитроглицерином, или ждут, когда онкологический приступ не даст проснуться. Кстати, мы еще с Вами не подсчитали вероятность смертельного исхода (по данным британской таблицы), Забегая вперед сообщаю, что если умножить относительную частоту четырехнедельного интервала на 12 , мы получим примерную оценку вероятности летального исхода в течение года в размере, близком к 2.5 процента (то есть внесли более или менее аккуратную поправку на продолжительность периода наблюдения и "горизонт прогнозирования выживаемости").В своей критике политики "навязанной вакцинации" эти люди Б делают акцент часто на политической конспирологии - на домыслах про "биологическое оружие", "чипизацию людей", "всемирный цифровой концлагерь", "истребление пенсионеров", "сокращение численности населения планеты до золотого миллиарда".
Вы думаете, что такие 2 психологики, которые я здесь описал, - это неадекватный бред? - Не торопитесь с оценочными суждениями. Что показали многочисленные эксперименты на людях и животных, проведенные в разных научных школах на тему "приспособление и выживание самоорганизующихся организмов в динамичных и вероятностных средах"? - Они показали, что ВСЕ животные существа (начиная с простейших и одноклеточных) ведут себя вполне разумно и адаптивно: они строят свое поведение в расчете на событие, которые ожидают с БОЛЕЕ ВЫСОКОЙ ВЕРОЯТНОСТЬЮ. Когда травоядное животное идет вечером жаркого тропического дня на водопой, куда могут прийти в этот же вечер и другие животные - в том числе опасные хищники, оно делает автоматическую, несознательную оценку вероятностей (у животных вообще нет сознания, но есть возможность накапливать в нейронной сети вероятностные связи): да, есть вероятность 0,1, что хищники нападут во время водопоя, но приходится выбирать, ведь еще выше вероятность умереть от жажды, и это смерть будет вообще неминуемой, если несколько дней подряд отказываться от водопоя (!). Все эти риски животное взвешивает постоянно и пока оно ориентируется на события, которые ожидаются с более высокой вероятностью, оно с этой же более высокой вероятностью и выживает. Как только животное начинает ошибаться и строит поведение в расчете на события, ожидаемые с более низкой вероятностью, это животное погибает.
Но... человек - это особое социальное животное, вовлеченное в знаковые коммуникации. Оно погружено в информационное общество, питается информацией от других особей, а не только живет на собственном опыте. Если человеку сообщают, что вероятность погибнуть на водопое все-таки выше, чем умереть от жажды, именно человек начинает к этой информации прислушиваться сильней, чем это свойственно животным. Огромная часть людей просто ничего "не просчитывает", а подражает лидерам - самым успешным представителям общества. Поэтому человек частенько во многих опасных и неопределенных ситуациях демонстрирует не адаптивное, а псевдоадаптивное поведение: начинает строить стратегию в расчете на менее вероятное событие. В быту таких людей пытаются образумить, им говорят: "Ну нельзя каждый свой день жить в расчете на форс-мажор, надо строить планы в расчете на нормальную мирную трудовую ситуацию экономического сотрудничества". Нет! - Эти люди считают, что значимость события, которое на самом деле наступает только в 1 случая из 50 в течение года (тяжелое течение ковида), так велика, что надо строить свое поведение в расчете именно на это событие - так, чтобы его полностью исключить. Почему они так думают? - Они тоже при этом адаптивны, но...живут в другом, своем мире. У них нет ДРУГИХ СТРАШНЫХ ПРОБЛЕМ. Они не умрут от жажды, У них есть запас денег, если потеряют на какое-то время работу. Для них ковид - это главная угроза. А для многих бедных людей: ковид - это ерунда по сравнению с 10-20 процентным риском стать жертвой вооруженного ограбления, рэкета, бытового насилия, вымогательства, врачебной ошибки и так далее. Поэтому-то, кстати, в более благополучных странах ковид-паника оказалась сильней, и население охотней пошло на добровольную вакцинацию (возьмите процент охвата населения вакцинацией в той же Швеции, где никого к этому не принуждали - не было такой нужды).
Итак,
ЛЮДИ ЖИВУТ В РАЗНЫХ МИРАХ И...
не понимают друг друга, так как субъективные вероятности и значимость одних и тех же событий для них сильно различаются.
ВМЕСТО ЗАКЛЮЧЕНИЯ
Что такое 2-3 процента? Все-таки много это или мало? Вот тут надо различать эффект для одного человека (для принятия индивидуального решения) и для больших групп. В индивидуальном случае этот эффект, как мы понимаем теперь, очень незначительный - он не покрывает многих других рисков, которые могут возникать в жизни конкретного человека. Но для больших организаций, особенно для крупных стран с многомиллионным населением это ОЧЕНЬ БОЛЬШОЙ эффект для сохранения системы здравоохранения. Ведь 3% от 1 миллиона (прошедших через вакцинацию за какой-то период) - это 30 тысяч койко-мест, освобожденных в системе госпиталей в стране (!). Для спасения гибнущей системы здравоохранения это имеет ОГРОМНОЕ значение (!).
ПРИЛОЖЕНИЕ ДЛЯ ЛЮБОЗНАТЕЛЬНЫХ
О том, как работают ЧТС в доказательной медицине, как на их основе рассчитываются показатели чувствительности и специфичности диагностических процедур (медицинских анализов, тестов) смотрите вот эту ссылку (их много, я привожу, можно сказать, первую попавшуюся по запросу на Яндекс-поисковике):
Чувствительность и специфичность Содержание а также Заявка на отборочное исследование [ править ] (hmong.ru)
Интересно, что на этой справочной веб-странице коэффициент сопряженности ФИ, известный психологам под именем психометриста Гилфорда, назван коэффициентом Мэтьюза. Очевидно, что исследованием ЧТС в разных науках параллельно занимались разные специалисты и независимо друг от друга разработали одинаковые коэффициенты. Один из первых и, пожалуй, до сих пор полных обзоров разных коэффициентов для ЧТС можно найти в огромном двухтомнике Кендалла и Стьюарта "Статистические выводы и связи" (М: Наука, 1973). Эта книга до сих пор является для меня практически настольной - сначала семидесятых годов.
Кстати, знаете почему в случае вакцинации не рассчитываются те же самые показатели "чувствительности" и "специфичности"? - Я не сразу сам ответил себе на этот вопрос. Но только тогда смог ответить, когда вооружившись компьютером, стал рассчитывать эти показатели для таблиц по данным реальной эффективности вакцин, только тогда я понял, почему об этих показателях наши "эпидемиологи" помалкивают. Оказывается, всегда в случае вакцинации один показатель оказывается очень большой (близкий к 1), а другой - слишком маленький (близкий к нулю). Так что средняя точность (accuracy) оказывается слишком низкой, чтобы такое средство можно было... продать. Поэтому-то и придуман другой показатель КЭВ, который помогает банально уйти от этого "казуса". А ведь что-такое "группа зараженных" и "группа незараженных" - это все те же самые реальные больные и реально здоровые, как в доказательной медицине. Тогда как "привитые" - это "положительная реакция на тест", а "непривитые" - это отрицательная реакция. Ну и что получается? Пытливые могут сами посчитать! Потому к этому вернемся (и так сегодняшняя статья у меня раздулась по объему до неприличия).
А вот здесь ссылка на наше форум "Экспертного Сообщества Профессиональных Психологов" (ЭСПП), где я попытался применить аппарат ЧТС как раз к анализу результатов тестирования на ковид. Выясняется, что точность ПЦР-теста низкая - ниже многих диагностических процедур в области психологического тестирования (!).
А знаете ли Вы что такое низкая прецизионность тестов на коронавирус? | Форум ЭСПП (ht-line.ru)
Эта статья про тесты на коронавирус ориентировала на разработчиков тестов и специалистов по оценке персонала. В нашей Дистанционной ПсихоМетрической Школе для этой категории специалистов первые 2 лекции посвящены как раз навыком анализа и осмысления ЧТС.
Здесь я обсуждаю, что между разными науками о человеке наблюдается такое парадоксальное несоответствие. Психологи тушуются и считают очень низкими такие показатели фи-коэффициента сопряженности (по данным их ЧТС), когда их психологический тест показывает значения только лишь в районе 0,2 - 0,3 (это я говорю про прогностическую валидность, а не про надежность методом тест-ретест). Почему тушуются? - Потому что чаще всего в их задачу входит точный прогноз в ИНДИВИДУАЛЬНОМ СЛУЧАЕ (!). А вот медики успешно продают свои лекарства и вакцины, хотя и у них коэффициенты сопряженности достигают иногда значений лишь в районе 0,07-0,08 (!!). А ведь в приведенной выше таблице фи-коэффициент равен вообще только лишь 0,04 (такой крошечный полезный эффект). Правда, следует признать, что выборки у медиков всегда больше по численности, а группы больных и здоровых сильно асимметричны (больных с определенным заболеванием всегда меньше, чем здоровых),
Но, есть еще традиция анализа ЧТС, созданная в бизнесе, а также в области разработки технических систем связи, искусственного интеллекта и машинного распознавания (обучения). Здесь эти ЧТС называют термином "confusion matrix" и с технарской тщательностью перечисляют гораздо больше разных показателей, сгруппированных по разным строкам и столбцам ЧТС. Тут и показатели вероятности "ложной тревоги", и ошибки типа "пропуск" и "прецизионная точность" и так далее. Разные показатели имеют разную ценность для разных ситуаций. Это Вам не "мышление в один процент".
Что такое матрица ошибок: насколько точен прогноз Machine Learning (bigdataschool.ru)
Между прочим, пресловутые 2-3 процента положительного эффекта, который мы получили и обсуждали выше, в теории анализа ЧТС частенько называют термином "Коэффициент дискриминативности" (КД). В нашей системе компьютерного тестирования HT-LINE, на которой базируется "Клуб Испытателей Тестовых Технологий" этот коэффициент автоматически рассчитывает для каждого тестового задания. Если в тесте 200 вопросов, то КД рассчитывается 200 раз. Современный мир все больше делятся на две категории людей: а) разработчики сложных систем (они все усложняют), б) пользователи этих систем (они все требуют упростить, так что разработчики путем все более сложных манипуляций с данными выкладывают пользователям все более "дебильную информацию").
Фото обложки автор заимствовал на yotube.com с подписью под ним
"В Петербурге сделали 16 тысяч прививок от коронавируса за сутки."
P.S.
Началось обсуждение. Как ни странно, не вполне довольным моими расчетами оказался как раз участник обсуждения прошлой статьи под ником "Данила", который предоставил исходную британскую таблицу. Ниже я решил все-таки опубликовать в главном сообщении свой ответ на вопросы и возражения Данилы.
Данила, Вы невнимательно (поверхностно) почитали статью. В ней изложена методика, которая легко позволяет Вам самому просчитать добавочную вероятность для смертности. Она еще ниже, чем для заражения (!).Почему? - Потому что летальный исход - это еще более редкое событие. Возьмите группу 60-69 (где контраст частот в пользу вакцинированных самый острый) , подставьте эти самые 4 и 19 в верхнюю строку ЧТС - по аналогии с тем, как я это сделал для заражения и получите прирост вероятности "не умереть" в размере ... всего только 0,06%. Понятно, что это в четырех-недельном интервале (один условный месяц). Умножаем на 12 и получаем в пересчете на год добавочную вероятность в размере 0,72%. Вообще-то с учетом новомодного 6 месячного интервала действия вакцины (до очередной ревакцинации), надо умножать только на 6, а не на 12. Тогда будет только 0,36%. А 100 000 - это обязательно сумма всех элементов ЧТС (всех четырех клеточек). Это множество численностью в 100 тысяч человек и делится в неравных пропорциях между "привитыми" и "непривитыми" (бинарный признак по столбцам), а также между "зараженными" и "незараженными". Кстати, если сделать, как Вы предлагаете, и задать сумму в каждом столбце как одинаковую в размере 100 000 (хотя так никто из профи не группирует данные), то результат окажется ...увы, гораздо более печальным для сторонников вакцинации :)
...У нас почти никто не умеет в стране считать вероятности. Пожалуй, кроме страховщиков-экономистов, которым приходится считать риски страховых случаев ТОЧНО - на этом строится их бизнес.