Найти в Дзене
Может ли ИИ создать, отредактировать базу данных?
К сожалению, в природе существует такое явление, как «Корявая База Данных». Приведение её в порядок способно значительно удлинить и усложнить путь исследователя к заветной статье или диссертации. А статистик-профессионал, получив такую базу для работы, обливается горючими слезами, понимая, что впереди его ждёт много потерянного времени. Причины возникновения КБД могут быть разными: Иногда на доработку корявой базы до приемлемого качества могут уходить дни и даже недели! А сможет ли искусственный...
3 недели назад
Как уменьшить влияние человеческого фактора на результаты сравнения разных методов лечения? Использовать рандомизацию с ослеплением.
Рандомизация предполагает, что пациенты будут распределены по сравниваемым группам случайным образом. Но если после рандомизации все участники исследования будут знать, в какую группу попал конкретный пациент, то они смогут сознательно или неосознанно повлиять на результаты. Например, пациент попал в основную группу, получает активное лечение новым препаратом. Как знание об этом может изменить результаты наблюдения? 🙎‍♂️ Пациент может внушить себе улучшение самочувствия, уменьшение боли и других субъективных симптомов...
1 месяц назад
Частый вопрос от исследователей: почему при сравнении групп у меня получилось такое p? Например, пациентов набрано много, показатель заметно различается в группах, а p-значение вдруг оказывается выше 0,05. Или наоборот: разница между показателями ничтожная, а p-значение говорит о том, что они статистически значимы. И закрадываются сомнения: все ли сделано правильно? Для того, чтобы объяснить величину p-значения, определим, как и от чего, в целом, она зависит: 1) Обратно - от величины эффекта, в качестве которого может выступать разность средних значений, разность процентных долей, отношение рисков и т.д. Чем больше величина эффекта, тем ниже p. 2) Обратно - от числа исследуемых. Чем больше наблюдений - тем ниже p. 3) Прямо - от вариабельности количественного показателя, которую, например, можно оценить по стандартному отклонению (SD), или от близости к 50% процентных долей. Чем выше SD или чем ближе процентные доли к 50%, тем выше p. Таким образом, условием статистической значимости эффекта являются: 🔸 большая величина эффекта, 🔸 большое число наблюдений, 🔸низкая вариабельность признака или близость процентной доли к 0 или 100%. Посмотрим, как работают эти правила на примере сравнения 2 групп по количественному признаку. Результаты сравнений в 4 случаях: А, В, С и D - представлены на диаграмме. P-значение, определенное во всех случаях с помощью t Уэлча, оказалось ниже 0.05 (p=0.008) только в случае D, когда были выполнены все 3 условия: ✔ Разность средних достаточно высокая: 6.9-4.7=2.2. ✔Число наблюдений достаточно большое - по 10 в каждой группе. ✔Вариабельность признака достаточно низкая: SD1=1.5, SD2=1.8. В случае A мы уменьшили величину эффекта, изменив среднее значение в первой группе на 5.7. Разность средних стала равна 1.2 вместо 2.2. И в ответ на это p-значение увеличилось до 0.122. В случае B мы увеличили вариабельность признака в 1 группе, SD1 стало равно 4.1 вместо 1.5. Это привело к увеличению p-значения до 0.148. В случае С мы уменьшили число исследуемых до 5 в каждой группе. В итоге р-значение составило 0.073. Таким образом, невыполнение хотя бы одного условия статистической значимости при сравнении групп способно привести к p>0.05.
3 месяца назад
Я знаю, вы скучали по нашему психоделическому комиксу про Шерлока Холмса. Ведь я и сам скучал по нему!😊 Итак, очередное убийство на конференции. Среди подозреваемых - 4 врача разных специальностей. Убийца оставил важную улику - кровавую надпись на стене🩸 Кто же совершил это дерзкое преступление? Ответы с номером предполагаемого убийцы шлите в комментариях к этому посту🕵️‍♀️
3 месяца назад
Взаимодействие факторов
Какое основное отличие многофакторных моделей от однофакторных? Многофакторные позволяют оценить взаимодействие факторов. Когда мы оцениваем зависимость изучаемого признака от какого-нибудь фактора, то должны понять, изменится ли наше предположение о значении этого признака, если мы будем знать значение фактора. Например, мы можем построить модель, где покажем, что артериальное давление (АД) зависит от возраста. О чем говорит такая зависимость? О том, что зная, какой возраст у человека, мы сможем предположить, какое у него АД...
3 месяца назад
Какой сервис использовать для написания научного текста?
Какой сервис использовать для написания научного текста? Современные ИИ-системы способны не просто извлекать данные, но и систематизировать их, проводить анализ и генерировать полноценный текст целых разделов научной работы. Если успели познакомиться с нашей статьей по результатам исследования предпочтений мужчин и женщин, могли заметить среди используемых нами новый сервис - STORM (storm.genie.Stanford.edu). Он разработан Стэнфордским университетом и позволяет создавать детализированные, хорошо структурированные обзорные статьи...
3 месяца назад
Как снизить вероятность ошибки первого рода при оценке доверительных интервалов для 3 групп и более?
При оценке различий 3+ групп с помощью p-значения одним из распространенных методов является поправка Бонферрони. В классическом варианте она заключается в уменьшении порога вероятности ошибки I рода α (альфа), с которым сопоставляется p, путем деления на число выполняемых сравнений между группами (обозначим его как k). Например, у нас 3 группы исследуемых, и мы хотим сравнить их все попарно: 1 с 2, 1 с 3, 2 с 3. Получается, всего будет 3 попарных сравнения, k=3. Значит, если мы хотим оценивать различия групп с вероятностью ошибки I рода, не превышающей 5% (α=0...
4 месяца назад
Готова первая статья от нашей Лаборатории «несерьезных» исследований
Мы решили сравнить мужчин и женщин по предпочтениям в еде, культурных мероприятиях, видах спорта и т.д. Получились довольно-таки интересные результаты. Но, мне кажется, самое важное, что полученные результаты мы смогли оформить в полноценную статью. Причем потратили на это всего пару часов! В этом нам помогли современные средства: электронные анкеты, статистические программы и, конечно, большие языковые модели (Large language models - LLM). Введение и обсуждение со списком источников были полностью сгенерированы искусственным интеллектом - LLMs Perplexity и STORM...
4 месяца назад
Какие данные можно разместить на графике выживаемости?
В статье Dummer R. et al. “Five-Year Analysis of Adjuvant Dabrafenib plus Trametinib in Stage III Melanoma” (N Engl J Med 2020;383:1139-48) встретился график с кривыми выживаемости, который, кажется, вместил в себе максимальное количество элементов. Начнём с графических элементов: 1.Кривые Каплана-Мейера, показывающие ступенчатое снижение безрецидивной выживаемости в группах пациентов, получавших разное лечение. Каждая ступенька вниз соответствует событию (рецидиву или смерти от любой причины), произошедшему на определенном сроке...
5 месяцев назад
Как не надо оформлять таблицы.
В этой рубрике мы не приводим данные авторов и названия статей. Только обращаем внимание на особенности представления результатов, которые трудно признать правильными. Вот пример очень плохо структурированной таблицы из опубликованной в 2025 году статьи. Если честно, не сразу сообразил, что именно хотят показать авторы. Сделайте остановку, посмотрите внимательно на первую картинку, сколько проблемных мест Вы заметите? Речь о сравнении 3 групп по показателю H-score. Заявлено использование ANOVA, данные представлены средними, SD, 95% ДИ...
5 месяцев назад
Первое исследование будет посвящено человеческим предпочтениям. Каждый из нас имеет свои предпочтения когда приходится выбирать: кошка или собака? чай или кофе? рок или поп-музыка?… Может быть нас это как-то характеризует, а может — и совсем никак. Просто кому-то нравится одно, кому-то другое. Мы решили изучить, как часто встречаются те или иные предпочтения и с чем они могут быть связаны. Примерное время заполнения опроса — около 2 минут. Дизайн исследования: поисковое, наблюдательное, поперечное. Участники исследования: все наши подписчики в возрасте 18 лет и старше, а также можете пригласить к участию Ваших коллег. Задачами исследования являются описание выборки респондентов по предпочтениям, выявление связи предпочтений с социально-демографическими признаками (пол, возраст, трудовая занятость). А ещё интересно, будут ли среди респондентов полные совпадения по всем ответам? Результаты исследования после соответствующего анализа будут опубликованы здесь, в нашем Телеграм-канале medstatistic_ru.
5 месяцев назад
Дорогие друзья! Встречайте новый проект от medstatistic под названием Лаборатория «несерьезных» исследований! В мире так много вопросов, которые официальная наука чаще всего обходит стороной: Кто больше любит кошек — женщины или мужчины? Какую музыку слушают представители разных врачебных специальностей? Какие soft skills отличают людей разного возраста? Влияет ли пожелание «Спокойного дежурства!» на то, как пройдёт это дежурство? Способна ли астрология предсказать удачный или неудачный день? Вообще-то подобные исследования в современной науке давно известны. Есть даже специальная Шнобелевская премия, которая вручается за решение, казалось бы, самых несерьезных вопросов. А самое интересное, что ответы на них иногда оказываются важными и интересными для всех. На «шнобелевку» претендовать не будем (пока), но постараемся использовать реальные современные средства для исследований. Потренируемся в планировании дизайна, сборе данных, анализе и интерпретации. Обзорную часть сделаем с применением библиографических менеджеров и ИИ. Мне кажется, это будет полезно! Схема проведения каждого исследования будет примерно такой: 1. Публикация протокола исследования. 2. Проведение эксперимента, сбор данных путем опроса среди подписчиков в течение нескольких дней.  3.Анализ данных в статистической программе, оформление результатов.  4.Публикация результатов исследования в нашем канале, а также, если получится, в журналах Nature и/или «Наука и жизнь».
5 месяцев назад