Найти в Дзене
IQ.HSE

Машинное обучение помогло предсказать очаги нестабильности и революций в мире

Оглавление
Wikimedia Commons
Wikimedia Commons

Сначала коротко

Проблема: Вооруженные и мирные протесты в истории — явление нередкое. Начиная с середины прошлого века наука активно изучает и пытается прогнозировать эти феномены социальной нестабильности.

Решение: Предсказать революционные события сложно из-за необходимости учитывать огромное количество показателей, особенно когда речь не об обращении к прошлому, то есть составлению индексов революций постфактум, а о стремлении разглядеть угрозы в будущем. На помощь приходят новые методы анализа больших массивов статистической информации на основе искусственного интеллекта. Например, машинное обучение.

Теперь подробнее

Учёные НИУ ВШЭ Андрей Коротаев и Илья Медведев применили машинное обучение (machine learning, ML) для построения индекса нестабильности в мире. Новый метод позволил использовать и нестандартно распределить большое количество переменных. Благодаря этому исследователям удалось предложить и успешно протестировать собственный способ построения индекса на период в пять лет, а также составить списки стран, где протесты наиболее ожидаемы. Результаты работы, выполненной при поддержке Российского научного фонда, представлены в ежегоднике «Системный мониторинг глобальных и региональных рисков» (том 12, 2021).

О чём речь?

Традиционных подходов к построению индекса нестабильности три. Первый (он практикуется чаще всего) — чисто математический, когда события предсказывают на небольшом количестве емких переменных, характеризующих развитие страны. Второй — метод «группировок и оценок» — индекс составляется на базе нескольких субиндексов (субиндекс безопасности, политический, экономический, социальный) плюс результаты корректируются экспертами. Третий — комбинированный — в финальную модель включают итоги математического моделирования и блок от экспертов.

Ни один из них, считают Илья Медведев и Андрей Коротаев, не даёт возможности отразить взаимодействие показателей разных категорий, учесть все страновые факторы и не потерять часть информации при объединении данных.

Чтобы это исправить, авторы исследования пошли своим путём. Алгоритмы искусственного интеллекта позволили взять в расчёт большое количество переменных и задействовать их в математической модели одновременно, то есть без разделения на субиндексы. От экспертных оценок отказались из-за их нестабильности и неуниверсальности для разных стран.

Как изучали?

Индексы строились с помощью моделей машинного обучения с учителем (supervised learning methods), то есть алгоритм обучался и делал прогноз исходя из загруженных данных и уже готового ответа (наличие революционных событий).

Для расчетов применили библиотеку Яндекса Catboost — модель машинного обучения с алгоритмом градиентного бустинга (gradient boosting). Под градиентом понимается вектор, задающий направление наиболее быстрого изменения величины, бустинг в переводе с английского — «усиление», а всё вместе — технология создания прогнозной модели в форме набора логических схем (деревьев решений), позволяющих получать ответ. «Усиление» означает, что несколько слабо обученных алгоритмов преобразуются в один сильный: каждый последующий учитывает ошибки предыдущего и улучшает предсказание.

Невооруженные и вооруженные протесты рассматривались порознь. Соответственно, предсказательных моделей получилось две, а на выходе — два индекса революционных событий. Первый — для мира в целом, и отдельно — для афразийской макрозоны, одного из самых взрывоопасных регионов. Прогнозировался не конкретный год революций, а вероятность их возникновения в течение пяти лет.

iStock
iStock

Для расчётов применили свыше 240 показателей (экономических, политических, демографических, социальных), взятых из нескольких баз: межнационального архива CNTS (Cross National Time Series Database, 200 стран с 1815 по 2020 год), отчёта МВФ Global Manufacturing Downturn, Rising Trade Barriers–2019, подборки статистики Всемирного банка World Development Indicators (2020) и др.

Что получили?

В перечень стран с наибольшим риском невооруженных выступлений вошли 25 государств. На вершине списка — Ливан, Гондурас, Алжир, Боливия, Черногория. А замыкают его — Колумбия, Афганистан, Доминиканская Республика, Индонезия, Узбекистан.

Предсказанный индекс риска начала невооруженных революционных выступлений

(топ стран мира с наибольшим риском в ближайшие пять лет — от наибольшей прогнозной нестабильности к меньшей)

Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»
Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»

В Ливане, комментируют исследователи, нестабильность действительно наблюдается уже много лет. В Афганистане вслед за завершившейся (вооруженной) революцией может последовать ещё одна — невооруженная.

На 14-й позиции расположилась Франция — страна из так называемого мир-системного центра, то есть государств с высокоразвитыми экономиками и политическим весом. В их случаях речь может идти о мирных манифестациях по типу движения «Жёлтые жилеты».

В целом в топе болевых точек преобладают страны со средним подушевым доходом из списка мир-системной полупериферии, то есть тех, кто занимает промежуточное положение между упомянутым центром и периферией, поставляющей государствам-лидерам сырьё и зависимой от них.

Протест в Алжире, 2019 год / Wikimedia Commons
Протест в Алжире, 2019 год / Wikimedia Commons

На результат в первую очередь повлияли социальные показатели (уровень угнетения отдельных слоёв населения, индекс свободы вероисповедания и проч.). Экономические и политические (подушевой ВВП, долговечность политического режима и др.) менее значимы и на последнем месте — демографические (например, плотность и численность населения).

Обратная ситуация — с предсказаниями вооруженных революций. Социальные факторы в этом случае отступают, а наибольший вклад вносят политические, отражающие характер режима в стране.

Первые места в списке 19 государств с вероятностью вооруженных конфликтов достались Индии, Анголе, Чаду, Нигеру, Бурунди. На другом полюсе — Ливия, Бангладеш, Мали, Мьянма, Египет.

Предсказанный индекс риска начала вооруженных революционных выступлений

(топ стран мира с наибольшим риском в ближайшие пять лет — от наибольшей прогнозной нестабильности к меньшей)

Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»
Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»

«Индия давно демонстрирует заметные проявления нестабильности; Нигер, Чад и Мали также не удивляют, в этих регионах уже длительное время состояние стран можно охарактеризовать как failed state — недееспособное государство», — поясняют Андрей Коротаев и Илья Медведев.

В отличие от прогноза по невооруженным выступлениям, рискам насильственных революций главным образом подвержена не полупериферия, а периферия — государства с «низкими подушевыми доходами, высокой рождаемостью, очень молодым, малообразованным и слабо урбанизированным населением».

Такой же результат, то есть готовность бунтовать с оружием прежде всего «периферийных» стран, продемонстрировала и афразийская макрозона — Ближний Восток (в том числе Северная Африка), Большой Средний Восток (включая Среднюю Азию и Пакистан) и Сахель. Прогноз для региона учёные, напомним, рассчитали отдельно.

iStock
iStock

Главные потенциальные угрозы в нём — территории с очень нестабильной экономической и политической обстановкой (Чад, Нигер, Южный Судан, Афганистан, Сирия, Пакистан, Йемен, Центральноафриканская Республика, Сомали, Ирак). На нижних позициях — те, чьи проблемы скорее социального плана: Грузия, Объединенные Арабские Эмираты (ОАЭ), Армения, Израиль, Оман.

«Для очень богатых стран макрозоны с монархическими режимами (таких как Катар или ОАЭ) характерны низкие риски вооруженной революционной дестабилизации», — отмечается в исследовании. Невооруженной, кстати, тоже: угроза «ненасильственных» выступлений наиболее актуальна для государств со средним по региону ВВП на душу населения и частично демократическим правлением (к примеру, Ливан или Ирак).

Для чего это нужно?

Предложенный метод на основе машинного обучения позволил оценить большой массив данных, составить не только актуальный индекс нестабильности, но и предсказать её на ближайшие несколько лет. Новый подход помогает «устранять множество проблем, с которыми сталкивались предыдущие исследователи», и в итоге делает прогнозирование более точным.
IQ

Авторы исследования:

Андрей Коротаев, заведующий Научно-учебной лабораторией мониторинга рисков социально-политической дестабилизации факультета социальных наук НИУ ВШЭ

Илья Медведев, стажер-исследователь Научно-учебной лаборатории мониторинга рисков социально-политической дестабилизации факультета социальных наук НИУ ВШЭ

Автор текста: Светлана Салтанова