В ходе одного из первых реальных испытаний искусственного интеллекта в медицинских исследованиях учёные из Калифорнийского университета в Сан-Франциско и Государственного университета Уэйна обнаружили, что генеративный ИИ может обрабатывать огромные массивы медицинских данных гораздо быстрее, чем традиционные команды специалистов по информатике, а в некоторых случаях даже выдавать более точные результаты. Эксперты-люди месяцами тщательно анализировали ту же информацию.
Чтобы напрямую сравнить эффективность, исследователи поставили перед разными группами одинаковые задачи. Некоторые команды полностью полагались на человеческий опыт, в то время как другие использовали инструменты искусственного интеллекта. Задача состояла в том, чтобы спрогнозировать преждевременные роды на основе данных о более чем 1000 беременных женщин.
Даже начинающая исследовательская группа, состоящая из студента магистратуры Калифорнийского университета в Сан-Франциско Рубена Сарвала и старшеклассника Виктора Тарки, успешно разработала модели прогнозирования с помощью искусственного интеллекта. Система сгенерировала работающий компьютерный код за считаные минуты — на это у опытных программистов обычно уходит несколько часов или даже дней.
Преимущество заключалось в способности ИИ писать аналитический код на основе коротких, но очень точных инструкций. Не все системы показали хорошие результаты. Только 4 из 8 чат-ботов с искусственным интеллектом сгенерировали пригодный для использования код. Тем не менее для работы с ними не требовались большие команды специалистов.
Благодаря такой скорости младшие научные сотрудники смогли завершить эксперименты, проверить полученные результаты и отправить их в журнал всего за несколько месяцев.
«Эти инструменты на основе искусственного интеллекта могут устранить одно из самых серьезных препятствий в науке о данных — создание конвейеров для анализа, — говорит Марина Сирота, доктор философии, профессор педиатрии, исполняющая обязанности директора Института вычислительных наук о здоровье имени Бакара (BCHSI) при Калифорнийском университете в Сан-Франциско и главный исследователь Исследовательского центра недоношенности при March of Dimes при Калифорнийском университете в Сан-Франциско. — Для пациентов, которым нужна помощь прямо сейчас, это как нельзя кстати».
Сирота — один из ведущих авторов исследования, опубликованного в Cell Reports Medicine.
Почему исследования преждевременных родов так важны?
Ускорение анализа данных может улучшить диагностические инструменты для выявления преждевременных родов — основной причины смертности новорожденных и одной из основных причин долгосрочных двигательных и когнитивных нарушений у детей. В США примерно 1000 детей рождаются недоношенными каждый день.
Ученые до сих пор не до конца понимают, что вызывает преждевременные роды. Чтобы изучить возможные факторы риска, команда Сироты собрала данные о микробиоме примерно 1200 беременных женщин, за которыми велось наблюдение в рамках девяти отдельных исследований.
«Подобная работа возможна только при условии открытого обмена данными, объединения опыта многих женщин и знаний многих исследователей», — сказала Томико Т. Оскотски, доктор медицинских наук, содиректор Репозитория данных о преждевременных родах March of Dimes, доцент кафедры акушерства и гинекологии Калифорнийского университета в Сан-Франциско и соавтор статьи.
Однако анализ такого обширного и сложного набора данных оказался непростой задачей. Чтобы решить ее, исследователи обратились к глобальному краудсорсинговому проекту под названием DREAM (Dialogue on Reverse Engineering Assessment and Methods — «Диалог об оценке и методах реверс-инжиниринга»).
Сирота была одним из руководителей одного из трех проектов DREAM, посвященных беременности, и занималась в основном данными о микробиоме влагалища. В проекте приняли участие более 100 команд со всего мира, которые разрабатывали модели машинного обучения для выявления закономерностей, связанных с преждевременными родами. Большинство групп завершили работу в течение трех месяцев, отведенных на участие в конкурсе. Однако на обобщение и публикацию результатов ушло почти два года.
Тестирование искусственного интеллекта на данных о беременности и микробиоме
Желая выяснить, может ли генеративный искусственный интеллект сократить эти сроки, группа Сироты объединила усилия с исследователями под руководством Ади Л. Тарки, доктора философии, соавтора и профессора Центра молекулярной медицины и генетики в Государственном университете Уэйна в Детройте, штат Мичиган. Тарка руководил двумя другими проектами DREAM, направленными на совершенствование методов определения срока беременности.
Исследователи дали указание восьми системам искусственного интеллекта самостоятельно сгенерировать алгоритмы на основе одних и тех же наборов данных из трёх задач DREAM без непосредственного участия человека в написании кода.
Чат-боты с искусственным интеллектом получали тщательно составленные инструкции на естественном языке. Как и в случае с ChatGPT, системы получали подробные подсказки, которые помогали им анализировать медицинские данные так же, как это делали участники программы DREAM.
Их задачи были аналогичны предыдущим. Системы искусственного интеллекта анализировали данные о вагинальном микробиоме, чтобы выявлять признаки преждевременных родов, а также исследовали образцы крови или плаценты для определения срока беременности. Срок беременности почти всегда определяется приблизительно, но от него зависит, какой уход будет получать женщина по мере развития беременности. Если срок беременности определен неверно, подготовиться к родам становится сложнее.
Затем исследователи протестировали код, сгенерированный искусственным интеллектом, на наборах данных DREAM. Только 4 из 8 инструментов позволили создать модели, которые по эффективности не уступали моделям, разработанным людьми, хотя в некоторых случаях модели на основе ИИ показали лучшие результаты. Весь процесс создания генеративного ИИ — от начала до публикации статьи — занял всего шесть месяцев.
Учёные подчеркивают, что искусственный интеллект по-прежнему требует тщательного контроля. Эти системы могут выдавать недостоверные результаты, поэтому человеческий опыт по-прежнему незаменим. Однако благодаря быстрой обработке огромных массивов данных о здоровье генеративный искусственный интеллект может позволить исследователям тратить меньше времени на поиск ошибок в коде и больше — на интерпретацию результатов и постановку значимых научных вопросов.
«Благодаря генеративному искусственному интеллекту исследователям с ограниченным опытом работы с данными не всегда нужно будет налаживать широкое сотрудничество или тратить часы на отладку кода, — говорит Тарка. — Они могут сосредоточиться на поиске ответов на актуальные биомедицинские вопросы».
Подписывайтесь, чтобы узнавать новое о науке каждую неделю!