65 подписчиков

"Терабайты медотходов" как мы собираем данные, которые никому не нужны

22 апреля22 апр

5 мин

Вы когда-нибудь задумывались, что происходит с вашей электронной картой после того, как врач её заполнил? Я вам скажу как человек, который эти карты видит изнутри. Чаще всего- ничего Она просто лежит в базе данных. Занимает место. Создаёт видимость работы. Но для аналитики, для страховых, для искусственного интеллекта - это мёртвый груз. Потому что больше половины информации в плохо настроенной МИС - это неструктурированный текст. Хаотичный. Который невозможно использовать ни для чего, кроме формальной отчётности. Мусор вместо данных: цифры, которые пугают Доступность качественных медицинских данных в России - это "серая область" МИС содержат только часть данных. Остальные до сих пор хранятся в бумажном виде или на сторонних носителях. А то, что есть в системах, как правило, не пригодно для машинной обработки в исходном виде. Эксперт по искусственному интеллекту ЦНИИОИЗ Александр Гусев (однофамилец, эксперт, который сделал огромный вклад в развитие ИИ в отечественной медицине) подтверд

Вы когда-нибудь задумывались, что происходит с вашей электронной картой после того, как врач её заполнил?

Я вам скажу как человек, который эти карты видит изнутри. Чаще всего- ничего

Она просто лежит в базе данных. Занимает место. Создаёт видимость работы. Но для аналитики, для страховых, для искусственного интеллекта - это мёртвый груз.

Потому что больше половины информации в плохо настроенной МИС - это неструктурированный текст. Хаотичный. Который невозможно использовать ни для чего, кроме формальной отчётности.

Мусор вместо данных: цифры, которые пугают

Доступность качественных медицинских данных в России - это "серая область"

МИС содержат только часть данных. Остальные до сих пор хранятся в бумажном виде или на сторонних носителях. А то, что есть в системах, как правило, не пригодно для машинной обработки в исходном виде.

Эксперт по искусственному интеллекту ЦНИИОИЗ Александр Гусев (однофамилец, эксперт, который сделал огромный вклад в развитие ИИ в отечественной медицине) подтвердил: "Более 50% информации в МИС- просто неструктурированные текстовые протоколы"

То есть каждый раз, когда врач пишет свободный текст, он создаёт данные, которые нельзя проанализировать автоматически. Их нельзя скормить нейросети. Их нельзя быстро найти по ключевому слову. Они просто лежат.

Это как если бы библиотекарь складывал книги в кучу без каталога. Вроде книги есть. А найти нужную невозможно.

Почему врачи пишут "от балды"

Я не буду винить врачей.

Представьте: у вас в кабинете толпа пациентов, каждый хочет внимания, а система требует заполнить кучу полей. В идеале нужно писать структурированно, выбирать из справочников, кодировать всё по стандартам. Но времени нет.

В результате врач пишет быстро. Сокращает слова. Использует разные формулировки для одного и того же. "Болит голова", "головные боли", "цефалгия"- в трёх разных картах это может означать одно и то же, но для ИИ это три разных симптома.

Методические рекомендации Минздрава требуют: "Во всех возможных случаях при заполнении полей ручной ввод данных должен быть заменен выбором из списков и справочников". На практике врачи всё равно пишут руками, потому что списки часто неудобные.

И получается замкнутый круг: система неудобная- врачи экономят время - пишут абы как - данные некачественные - систему нельзя улучшить, потому что данные - мусор.

Как выглядит хорошая запись и как - плохая

Давайте сравню на простом примере.

Плохая запись (неструктурированный текст):

Пациент жалуется на головные боли, возникающие после работы за компьютером, принимал цитрамон, эффект слабый, давление в норме, рекомендовано наблюдение

Хорошая запись (структурированная):

Симптом: цефалгия (код R51 по МКБ-10)
Триггер: работа за компьютером более 4 часов
Самолечение: цитрамон, эффект отсутствует
Артериальное давление: 120/80
Рекомендация: наблюдение без терапии

Первый вариант врач напишет за 30 секунд. Второй будет заполнять минуты три. Но второй можно анализировать. Второй можно скормить нейросети, которая через год заметит: "У пациентов с такой жалобой часто выявляют проблемы с шейным отделом". Первый так и останется текстом, который никто никогда не перечитает.

Эксперт Борис Кобринский предупреждает: большие данные, накопленные за несколько лет, могут содержать искаженную информацию, если в этот период менялись классификации, методы лечения или возникали ошибки.

То есть даже если данные есть, это не значит, что они годятся для анализа.

Почему ИИ не сможет лечить по нашим картам

Теперь про самое актуальное - про искусственный интеллект, который нам обещают.

ИИ работает по принципу GIGO - Garbage In, Garbage Out ("мусор на входе, мусор на выходе"). Если скормить нейросети противоречивую или некачественную информацию, она не выдаст правильный ответ, а сгенерирует убедительную ложь. Галлюцинацию.

У нас в стране анонсируют тотальный анализ всех электронных карт с помощью ИИ. А чем эти карты наполнены? Неструктурированным текстом. Свободными формулировками. Сокращениями, которые понятны только врачу, который их написал.

Исследование, проведённое на конференции ITM-AI, показало: данные в МИС приходится проверять на достоверность и разделять на заслуживающие доверия и сомнительные.

Если в медорганизации используются автоматизированные лабораторные системы и диагностические комплексы - доля ошибок минимальна. Но если врач вводит всё руками - количество ошибок зашкаливает.

Тот же Кобринский привёл пример: система IBM Watson показала точность 95% в отдельных клиниках США, но в Дании её точность упала до 33% - потому что в европейских клиниках практикуют иные подходы к лечению.

Вывод простой: если мы хотим, чтобы ИИ работал, нужно сначала навести порядок в данных. А этого никто не делает.

Что с этим делать (и кто виноват)

Виноваты все. И никто.

Виноваты разработчики МИС, которые делают неудобные интерфейсы. Виновато руководство клиник, которое не контролирует качество заполнения. Виноваты врачи, которые экономят время. Виноваты чиновники, которые требуют отчётов, а не качества. Я не люблю искать виноватых. Я люблю искать решения.

Перестать требовать от врачей невозможного.

Нельзя заставить врача заполнять 100 полей структурированных данных на каждом приёме. Значит, нужно сокращать количество обязательных полей до реального минимума. Оставлять только то, без чего действительно нельзя.

Автоматизировать там, где можно.

Если данные уже есть в системе - не заставляйте врача вводить их повторно. Автоматически подтягивайте анализы из лаборатории, давление из тонометра, диагноз из предыдущего приёма.

Учить врачей работать с данными.

Не "как нажимать кнопки", а "зачем это нужно". Показать на цифрах: когда вы пишете структурированно, страховые платят, ИИ помогает точнее, пациенты получают лучшее лечение. Люди меняют поведение, когда видят результат.

Настроить контроль на входе.

МИС должна проверять качество заполнения в реальном времени. Если врач ввел "головные боли" свободным текстом, а в справочнике есть код R51 - система должна предложить выбрать из справочника. Не блокировать, а помогать.

В методических рекомендациях Минздрава это прямо прописано: МИС должна корректно обрабатывать неверный формат или недопустимые значения входных данных, выводя пользователю сообщение об ошибке и рекомендации по её устранению.

Итого

Терабайты медицинского мусора - это не про то, что врачи плохие. Это про то, что система не даёт им возможности работать чисто.

Мы строим цифровую медицину, но забываем про главное - про качество данных на входе. Без этого любая цифровизация превращается в цифровой фарс.

Хотите настоящей цифровизации? Начните с малого. Сделайте так, чтобы врач мог заполнять карту быстро и правильно. И не наказывайте его за то, что он экономит время. Лучше дайте ему инструменты, которые помогут не ошибаться.

Потому что мусор на входе - это мусор на выходе. И чем раньше мы это поймём, тем меньше денег и жизней потеряем.

#мис #качестводанных #ии #цифровизация #врачи #медицина #аналитика #gigo #медданные #эффективность