Рассказываем о технологиях для прогноза ЧС и почему искусственный интеллект не решит все наши проблемы.
В конце декабря 2019 года в китайском городе Ухань появились сообщения о первых случаях инфекции, позднее названной COVID-19. С 22-24 января власти закрыли город и прилегающие к нему округа на карантин. Представитель ВОЗ в Пекине Гауден Галеа отметил, что «изоляция 11 миллионов человек — беспрецедентна в истории общественного здравоохранения, и ВОЗ не рекомендовала подобные меры».
Меньше через месяц её позиция кардинально изменилась, но еще до того, как ВОЗ объявила пандемию, о риске новой эпидемии предупреждал канадский стартап на базе искусственного интеллекта (ИИ) BlueDot.
В поиске информации о новых болезнях система ежедневно сканирует более 100 000 официальных источников и СМИ на 65 языках. 30 декабря программа засекла сообщение департамента здравоохранения Уханя, предупреждающего медицинские учреждения города о подозрительном заболевании. На основе анонимных данных о миллиардах авиаперелетов и сотнях миллионов смартфонов программа определила города, где появятся зараженные новым вирусом. В список вошли Бангкок, Гонконг, Токио, Тайбэй, Пхукет, Сеул, Сингапур и другие. 13 января был выявлен первый случай COVID-19 в Бангкоке, а потом и в других 11 отмеченных городах.
Это не первый подобный случай применения ИИ для прогнозов, но его возможности пока ограничены. Система могла строить прогнозы распространения вируса только до закрытия авиасообщений, а выявление потенциальных угроз на основе мониторинга инфополя – вспомогательный инструмент. Решение остается за человеком. Разбираемся, на что способен искусственный интеллект в прогнозировании эпидемий и почему на его прогнозы по распространению вируса нельзя полностью полагаться.
Как прогнозируют распространение эпидемий?
Когда аналитик выдвигает предположения относительно колебаний курса валюты, а врач оценивает успешность операции – они делают прогноз, опираясь на имеющиеся опыт и знания. Подобные предположения называются прогнозами на основе суждений. Такой прогноз сделал главный врач Австралии Брендан Мерфи, предположив, что COVID-19 не станет угрозой. В прогнозе он опирался на данные, полученные на раннем этапе, но их оказалось недостаточно, чтобы прогнозировать долгосрочное развитие ситуации и учесть все возможные риски.
При наличии большого объема данных ученые используют различные статистические методы прогнозирования. Например, регрессионный анализ. Он позволяет предположить причинно-следственную связь между выбранными переменными, а также выявить тенденции и зависимости, на основании которых можно прогнозировать события. Но в случае с распространением пандемии у этого метода есть ограничения.
«Некоторые авторы вполне обоснованно считают прогнозирование неразрешимой задачей для любых социальных систем (Нассим Талеб «Чёрный лебедь»). В области математической эпидемиологии предлагается огромное количество моделей распространения эпидемий разной степени сложности в зависимости от количества учитываемых факторов, характера взаимодействия агентов и других показателей. Чтобы спрогнозировать распространение эпидемии, необходимо корректно определить параметры таких моделей: смертность, среднее количество контактов, среднее количество случаев инфицирования, инкубационный период. Оценить эти параметры – ещё одна сложная задача. Ее решение также зависит от политических и социальных аспектов. Например, некоторые госслужащие США и Великобритании заявляли, что сомневаются в данных о заболеваемости и смертности в Китае», – объясняет Сергей Панченко, доцент кафедры Телекоммуникационных сетей и систем Алматинского университета энергетики и связи.
Классические эпидемиологические модели не всегда учитывают различия в сдерживающих мерах в зависимости от страны. Поэтому можно встретить много отчётов с очень разными прогнозами: некоторые рассматривают наихудший сценарий без внедрения каких-либо сдерживающих мер, другие — учитывают факторы, которые разнятся от модели к модели.
Например, казахстанский Центр анализа и расследования кибератак (ЦАРКА) рассмотрел самый пессимистичный вариант пандемии в Казахстане, схожий с европейскими сценариями. Модель, анонсированная в марте, спрогнозировала 17 тысяч выявленных случаев COVID-19 в стране к 10 апреля. Этот прогноз не оправдался.
Были и другие модели, учитывающие большее количество факторов, но с прогнозом на меньший срок. Учёные из Университета Роберта Коха в проекте «Горизонт событий — COVID-19» использовали данные от Университета Джона Хопкинса, а их эпидемиологическая модель учитывала влияние социального дистанцирования и государственных мер для сдерживания пандемии в разных странах. Модель прогнозировала общее количество заразившихся COVID-19 на шесть дней вперед и ожидаемое число новых случаев ежедневно. Посмотреть график можно здесь.
Как используют ИИ в прогнозировании ЧС?
Оценивать большие массивы данных и выявлять между ними закономерности исследователям также помогает вычислительная мощность машин. Причём их можно научить самостоятельно искать закономерности и делать прогнозы. С такими задачами машины справляются не хуже, а в чем-то даже лучше людей. Все благодаря технологиям машинного обучения, под которыми часто подразумевают искусственный интеллект.
ИИ – широкая научно-технологическая сфера по созданию устройств или программ для решения разных интеллектуальных задач. Будь это камера с распознаванием лиц или бот для трейдинга, программу сначала нужно научить выполнять определенные действия. То же самое с прогнозированием. Существуют разные методы машинного обучения, но общее у них то, что машины обучаются, решая множество похожих задач. При этом нейросети и глубокое обучение далеко не единственное направление машинного обучения.
«Нейросети для прогнозов тоже используют, но отличные от тех, что, например, распознают лица. При прогнозировании каких-то явлений во времени мы фактически работаем с временными рядами, здесь популярны рекуррентные сети. У таких сетей есть "память", которая хранит информацию об истории в прошлом. Они работают не с двумерными данными, как картинки, а с трехмерными, при этом время — обязательная характеристика. Рекуррентные сети обобщают историю: вот тут бабахнуло, вот тут треснуло, значит скоро рванёт», – объясняет Виолетта Гайдак, ведущий аналитик по Data Science в «Газпромнефть – Альтернативное топливо».
Прогнозированием возможных катаклизмов с помощью ИИ занимаются как большие корпорации, так и научные институты, иногда объединяя усилия. Так, Google совместно с Гарвардским университетом разработал систему искусственного интеллекта, которая предсказывает повторные толчки после землетрясения. В нейронную сеть загрузили данные о более чем 31 тысячи землетрясений. Исследователи проверили ее на 30 тысячах событий, и система более точно предсказала места повторных толчков по сравнению с традиционными методами.
Успех искусственного интеллекта в этой области обусловлен одним из главных достоинств технологии – способностью обнаруживать ранее пропущенные шаблоны в сложных наборах данных. Это актуально в сейсмологии, где подземные толчки включают слишком много переменных: от структуры грунта в разных областях до типов взаимодействий между сейсмическими плитами и распространения толчков.
Аналогичные проекты на основе нейросетей есть и в других странах. Например, Япония использует спутники, чтобы получить изображения Земли для прогнозирования стихийных бедствий. Системы на основе ИИ ищут изменения в изображениях, чтобы предсказать риск землетрясения и цунами. Те же системы способны обнаруживать деформации в конструкциях.
Также Google создал ИИ для прогнозирования наводнений в Индии, который рассылает пользователям предупреждения через Google Maps и Google Search. Специалисты обучают нейросеть на данных об осадках и климате, и используют технологии моделирования.
«Разнообразие элементов, например, показания уровня реки и рельеф местности, вносят вклад в наши модели. С помощью этой информации мы создали модели прогнозирования паводков, которые могут более точно прогнозировать не только когда и где может произойти наводнение, но и насколько серьёзным оно будет», - отмечает вице-президент по инженерным разработкам Google, Йосси Матиас.
Прогнозирование природных катаклизмов на основе ИИ – перспективное направление, но технологии нуждаются в доработке. Стихийные бедствия нередко происходят в слаборазвитых регионах, где нет эффективной сети датчиков, а быстрая передача данных и оповещение населения затруднены. Также в прогнозах нейросети используют данные о прошлых стихийных бедствиях и могут не учитывать новые факторы, например, изменение климата.
Насколько ИИ применим для прогнозирования эпидемий?
Нейросетевые методы для прогноза социальных событий пока не разработаны. Эпидемические модели используют входные данные для оценки небольшого количества параметров, на основе которых потом строятся временные диаграммы. Нейросетям же для обучения необходим большой объем входных данных, а количество обучаемых параметров в их случае огромно.
«Узконаправленный искусственный интеллект не решит все наши проблемы, а задачу прогнозирования в социальных системах (сложных системах) не решит однозначно. Возможно, с развитием технологий, нейросети смогут заменить остальные методы. Но вопрос качества обучающих данных остаётся открытым. Сейчас они сильно зависят от доступной выборки, а того, что есть, недостаточно», – считает Сергей Панченко.
Сбор данных затрудняет несколько факторов, например, политика приватности, а также инфраструктурные, и финансовые ограничения. При этом ИИ может оказаться бесполезен без экспертных знаний о конкретной проблеме. Инженеры машинного обучения могут отлично выполнять свою работу, но чтобы учесть возможные факторы, им, как минимум, потребуются консультации эпидемиологов, учёных и других специалистов.
Также ИИ бывает предвзят. Например, в препринте одного научного исследования говорится, что для прогнозирования риска смертности пациентов с COVID-19 можно использовать биомаркеры. Исследование основано на данных пациентов из Уханя и направлено на определение приоритетов в помощи наиболее уязвимым группам. Цель работы звучит благородно, но нет гарантии в точности результатов.
Биологические ассоциации между расой, полом, возрастом и другими биомаркерами могут привести к искаженным оценкам. Например, если предположить, что китайские мужчины много курят, и не учитывать этот фактор, а искать связи заболевания с полом, расой или возрастом, то модель сместится в пользу переоценки риска смерти мужчин. Но на практике не факт, что именно мужчины болеют чаще: влияет не пол, а фактор курения. В итоге, это приводит к дискриминационным результатам, хотя модели искусственного интеллекта часто рассматриваются как объективные и нейтральные.
Сомнения есть и в точности прогнозов. ИИ может конкурировать с людьми по объёму и скорости операций, но далеко не всегда по качеству прогнозов. Если соцсеть не узнала людей на фотографии, это не страшно. Другое дело, если система, предсказывающая подземные толчки, ошиблась в прогнозировании их местоположения. Тогда ценой могут стать человеческие жизни. Чтобы полностью положиться на ИИ в таких ситуациях, технологии должны подтвердить надёжность для работы в реальных условиях.
Хотя прогностические возможности ИИ далеки от идеала, его совершенствование продолжается. Например, в клинической диагностике заболеваний. Нейросети способны оценить злокачественность аномалий тканей, находить изменения в структуре скелета и определять явные признаки разных патологий. Все это позволяет снижать потребность в некоторых дорогостоящих и неприятных диагностических процедурах.
Также разработанные с помощью ИИ новые лекарства начинают испытывать на добровольцах. Он способен обобщать десятки тысяч отдельных научных работ и находить в них закономерности. Это ускорит поиски лекарств, вакцин и подходов в лечении как в случае с COVID-19, так и в целом. Всё это поможет бороться с эпидемиями, развивать мировое здравоохранение и другие исследования.
Автор: Анастасия Горбунова
Редактор: Роман Лукьянчиков
Иллюстрация к статье: Дария Каби