Найти в Дзене

Технологии больших данных в политических процессах: возможности и риски. (2019)

Оглавление

Для цитирования:

Мухаметов Д. Р. Технологии больших данных в политических процессах: возможности и риски. (2019) / Мухаметов Д. Р.; под ред. Рыбалко Я. А. / Дневничок Ярослава. [Электронный ресурс] // Дзен : [сайт]. — URL: https://dzen.ru/media/id/5ed518364abd40028a04e8d3/tehnologii-bolshih-dannyh-v-politicheskih-processah-vozmojnosti-i-riski-2019-6555d9b640ee124813640190 (дата обращения: 00.00.0000).

Аннотация: В статье рассматриваются различные стороны, связанные с использованием анализа больших данных в политических процессах. Цифровые технологии оказывают двойственное влияние на общественно-политические процессы, так как создают «серую зону» возможностей, которые являются предметом конфликтов и конкуренции различных субъектов политических действий. На первом этапе описывается концепция политической компании, основанной на данных в политике, которая получает распространение в силу востребованности гибких механизмов управления и формирования «экономики внимания». Практическое осуществление концепции включает этапы сбора и алгоритмического анализа данных (создание психологических профилей и психограмм), сегментирование аудитории и адресная агитация (микротаргетинг) — в статье раскрывается содержание каждого из них на примере актуальных случаев. Преимущество использования анализа больших данных заключается как в масштабах анализируемой информации, так и в поиске более глубоких причинных связей и зависимостей, что расширяет спектр возможностей воздействия на поведение политических субъектов. На втором этапе рассматривается возможность экстраполяции механизмов политической компании, основанной на данных на уровень общего управления и политики, управляемой данными. Формулируются основные риски и угрозы, связанные с технологиями больших данных в политических процессах: воронка недоверия к политическим институтам и технологиям, размывание принципов плебисцитарной демократии, конфиденциальность персональных данных, использование коммерческих данных в политических целях, последствия когнитивных ограничений алгоритмов и принятия решений на их основе. Как следствие, в краткосрочной перспективе будут актуальны вопросы институционального регулирования использования данных пользователей, а также защита персональных данных через совершенствование инструментов кибербезопасности и развитие человеческого капитала как базовых навыков использования современных технологий.

Содержание

  • 1. Введение
  • 2. Анатомия политической компании, основанной на данных и ее использование в политических процессах.
  • 2.1. Понятие и причины популяризации.
  • 2.2. Сбор данных.
  • 2.3. Анализ данных, психометрический анализ и сегментирование аудитории.
  • 2.4. Распространение адресной агитации.
  • 3. От политической компании, основанной на данных до политики, управляемой данными: риски и угрозы.
  • 3.1. «Воронка недоверия» к политическим институтам.
  • 3.2. Размывание демократических принципов.
  • 3.3. Конфиденциальность личных данных.
  • 3.4. Когнитивные ограничения алгоритмов.
  • 4. Заключение.
  • 5. Список литературы.

1. Введение.

Использование цифровых технологий в общественно-политических процессах характеризуется двойственностью возможностей и угроз. С одной стороны, государство всегда стремилось упростить общество, сделать его максимально «видимым» для установления желаемого общественного порядка [1]: в этом отношении технологии сбора и анализа данных позволяют количественно и качественно увеличить собираемую государством информацию о гражданах и предоставляют новые ресурсы контроля и управления.

С другой стороны, новые технологии содействуют процессам децентрализации и открывают новые формы самоорганизации граждан: в перспективе развитие интернета вещей, системы распределенных реестров и аддитивного производства может способствовать исключительной роли государства как регуляторного посредника из жизни отдельных групп общества [2].

Важно признать, что неопределенность потенциала использования цифровых технологий создает «серую зону» возможностей, ресурсов и инструментов, которые становятся предметом конфликтов и конкуренции между широким кругом субъектов политического действия. В частности, это находит выражение в сфере избирательного процесса: вследствие экспоненциального роста персональных данных и их сбора происходит деанонимизация и нивелирование личной сферы; тренд цифровой виртуализации благоприятствует росту недостоверных новостей и адресных манипуляций — подобные вопросы являются объектом настоящей работы.

2. Анатомия политической компании, основанной на данных и ее использование в политических процессах.

2.1. Понятие и причины популяризации.

В общем понимании политическая компания, основанная на данных определяется как использование больших данных в политических процессах, в первую очередь в избирательном. Возрастающая распространенность ее применения обуславливается следующими причинами.

Во-первых, технологии компании, управляемой данными могут предоставить политическим организациям ресурсы как более детального исследования собственных избирателей и общественных групп, так и их эффективной мобилизации — это позволяет преодолеть ригидность бюрократических машин и их неспособность ответить на вызовы окружающей среды.

Во-вторых, требуются инструменты управления ограниченной рациональностью избирателей, и в этом отношении теория политической компании, управляемой данными может реализовать идеи поведенческой экономики, в частности, теорию «подталкивания» (nudge theory) Р. Талера [3]. В условиях ограниченной рациональности субъектов и наличия разрыва между знанием, намерениями и действиями (knowledge-attitudes-practice gap [4]) процесс принятия решений сопровождается ростом трансакционных и когнитивных издержек, а принятые решения могут оказаться несоответствующими параметрам ситуации: во избежание этого необходимо предоставление дифференцированных стимулов, которые при сохранении выбора указывают на наиболее выгодное решение (что также может стать средством спекуляции). В контексте использования больших данных в роли описанных стимулов выступает нацеленная информация, предоставляемая на основе собранных данных.

В-третьих, рост и избыток информации влияет на развитие «клипового мышления» — человек склонен тратить значительно меньше времени на оценку предложений на рынке: в данных условиях формируется «экономика внимания» (attention economy) [5], в рамках которой внимание пользователей — выборочное фокусирование на отдельных стимулах — становится ограниченным ресурсом и предметом конкуренции организаций. Таким образом, стратегия политической компании, основанной на данных позволяет через внедрение цифровых платформ и анализ цифрового следа пользователей предоставлять им адресную агитацию и концентрировать внимание пользователей на определенных товарах, услугах, сообщениях.

Приведенные аргументы являются основанием для дальнейшего анализа использования компаний, основанных на данных в политике. В общем плане процесс политической компании, основанной на данных можно представить как последовательное прохождение трех стадий: (1) сбор данных избирателей, (2) анализ данных и формирование психологических профилей, (3) нацеленное распространение сообщений и воздействие на избирателя.

2.2. Сбор данных.

Можно выделить три варианта организации сбора данных: тестирование и извлечение данных пользователей социальных сетей, использование программных интерфейсов (API), сторонних подрядчиков (аутсорсинг). Сбор данных в рамках политической компании, основанной на данных осуществляется всеми тремя описанными способами, однако за последние несколько лет можно обозначить тенденцию роста участия в этом процессе коммерческих предприятий широкого профиля.

Пользовательское тестирование является традиционным способом извлечения информации: пользователям предлагается ответить на список вопросов, исходя из ответов на которые определяется психологический профиль человека. При прохождении теста необходимо согласие на передачу данных профиля организаторам теста, которые в дальнейшем используются для моделирования психологического профиля.

Исследования при помощи программного интерфейса или API-исследования — это подход в цифровой социологии, основанный на извлечении записей из наборов данных, доступных сетевым платформам через их интерфейсы прикладного программирования (API — Application Programming Interface) [6, 7]. Этот вид сбора позволяет агрегировать подробную информацию о больших группах населения при отсутствии прямого контакта с ними, поэтому сегодня использование API-доступа является распространенным методом социологических исследований ввиду значительного объема «сырых» количественных данных, которые они могут предоставить.

Стоит отметить, что в контексте избирательных кампаний политические организации редко обладают достаточными техническими ресурсами и знаниями для масштабного сбора данных, поэтому наиболее распространенным решением является наем подрядчиков (аутсорсинг) — передача части функций сторонней профессиональной структуре. Так как в большинстве случаев собираются данные, в том числе относящиеся к коммерческой сфере, проблема на данном этапе заключается в стирании границы между данными, собираемыми в политических целях, и данными, собранными в коммерческих целях, направленными на более качественное профилирование предпочтений потребителей. Как следствие, в настоящее время на политическом рынке формируется новый тип игроков в лице коммерческих компаний, которые обладают необходимыми техническими инструментами и предоставляют готовые решения сбора и анализа данных для политических организаций: однако следует учитывать, что компании отличаются в зависимости от того, данные какого типа они предоставляют.

Наиболее распространенными являются организации по исследованию социальных служб (Social listening companies), которые специализируются на мониторинге и анализе дискуссий в социальных сетях по конкретной теме, кандидату, партии или бренду [8]. Однако в последние годы заметен тренд на привлечение к кампаниям «брокеров данных» (data brokers), собирающих информацию о пользователях из различных источников, включая социальные сети, государственные записи и покупку данных у частных компаний [9] — объем информации, имеющейся у «брокеров данных», зависит от законодательного регулирования сферы использования данных страны, в которой они осуществляют свою деятельность.

2.3. Анализ данных, психометрический анализ и сегментирование аудитории.

Собранные данные анализируются с помощью алгоритмов машинного обучения для создания психограмм пользователей и микротаргетинга. Технически первичный анализ осуществляется уже в процессе агрегирования, так как некоторые программы баз данных включают опцию визуализации данных пользователей. Однако современная политическая агитация сопряжена с большими требованиями к сбору и анализу данных: востребованным становится не только агрегирование данных об избирателях, но и предоставление инструментов для воздействия на них. Получают развитие компании, включенные в сети обмена данными и информацией, имеющие необходимые ресурсы и программное обеспечение для их хранения и анализа — наиболее известной из подобных организаций является «Кэмбридж Энэлиткэ» (Cambridge Analytica), которая одной из первых ввела практику психометрии широкой аудитории через измерение модели технологических гигантов на основе данных пользователей социальной сети «Фэйсбук» (Facebook) (психограмма технологических гигантов отражает такие характеристики, как нейротизм, открытость новому опыту, экстраверсия, сознательность, доброжелательность).

Традиционными способами получения информации для психометрии выступали проведение опросов, анкетирование участников, что априори обуславливает два типа барьеров для наиболее полного определения психологического профиля: во-первых, ограничение выборки и, во-вторых, склонность респондентов при прямом опросе уточнять свои ответы, особенно в отношении вопросов о политических предпочтениях.

При использовании больших данных и данных социальных сетей психометрический анализ проводится на базе «цифрового следа»: производимый инфомацинный материал, отправляемые сообщения, интересующие страницы, группы, новости, геометки, ключевые слова используются как исходный материал для алгоритма и применяются для выявления выше-обозначенных измерений психотипа личности. Алгоритмы, используемые для психотипирования, в большинстве случаев имеют вид регрессионных, кластерных или классификационных моделей. На первом этапе через проведение психологических тестов в социальных сетях и интернет-пространстве определяются психологические наклонности пользователя; параллельно в рамках тестовых приложений агрегируются данные цифрового следа пользователя — отметки «мне нравится», опубликованные сообщения, подписки на каналы и сообщества. На втором этапе через модели алгоритмов производится поиск взаимосвязей между ответами пользователя и данными его цифрового следа, которые позволяют выявить его психологические характеристики: данный подход может быть в равной степени использован для определения психологического профиля пользователей разных социальных сетей вне зависимости от формы цифрового материала, на котором апробируются и тестируются алгоритмы: «Твитэ» (Twitter), «Фейсбук» (Facebook), «Инстаграм» (Instagram) [10-12].

Данный подход позволяет преодолеть ограничения традиционных методов за счет анализа данных широкой аудитории, не ограниченной условиями выборки, а также вследствие обработки большого массива информации о пользователе и поиска неочевидных причинных связей и зависимостей, определяющих поведение, благоприятствующих адресной агитации (микротаргетингу).

2.4. Распространение адресной агитации.

Третий этап — распространение адресной агитации: после сегментирования аудитории агитационные сообщения в различной форме доставляется до потенциального избирателя для воздействия на его решение — ключевыми каналами распространения являются общественные средства информации, посещаемые пользователем сайты и форумы, мессенджеры, электронная почта. Тем не менее социологические исследования демонстрируют неоднозначность оценки влияния адресной агитации — в частности, опрос пользователей «Фэйсбук» (Facebook) в США после скандала с «Кэмбридж Энэлиткэ» (Cambridge Analytica) выявил, что 32% респондентов не обращают внимания на рекламные объявления и воспринимают их наравне с публикациями других пользователей.

Распространение адресной политической агитации направлено на запуск «эмоционального заражения» — включение человека в определенный контекст, благоприятствующий ожидаемой психологической реакции. Механизмы эмоционального заражения широко варьируются и в большинстве случаев подразумевают непосредственный контакт, однако распространение социальных средств информации и потенциал моделирования поведенческих реакций человека исходя из анализа его цифрового следа позволяют осуществлять эмоциональное заражение опосредованно, сохраняя при этом индивидуальный подход [13]. Это становится возможным с помощью погружения индивида через точечное нацеливание (микротаргетинг) в сравнительно изолированную информационную среду, в которой артикулируется поток новостей, соответствующих психограмме человека и склоняющих его к совершению ожидаемых действий. В большинстве случаев информация, транслируемая через точечное нацеливание (микротаргетинг), носит негативный характер — чувство угрозы и демонизация имеют больший мобилизационный потенциал, нежели положительные образы и события. В частности, использование данной техники в контексте избирательной кампании Д. Трампа позволило мобилизовать малоинформированных избирателей (low-information voters) — неоднородную группу населения, в силу разных причин аполитичных или критично настроенных по отношению к политическим новостям, событиям, избирательному процессу [14].

3. От политической компании, основанной на данных до политики, управляемой данными: риски и угрозы.

В перспективе политическая компания, основанная на данных может быть масштабирована в парадигму политики, управляемой данными, что сопряжено с рядом общественно-политических проблем, связанных с ростом контроля и ограничением личной сферы. Представляется возможным выделить несколько общих категорий рисков и угроз.

3.1. «Воронка недоверия» к политическим институтам.

Проблема «воронки недоверия» к новым технологиям и политическим институтам вследствие роста ресурсов контроля и манипулирования. Исследователь из Гарвардского университета Дж. Зиттрейн предложил определение «интеллектуальный долг» (intellectual debt) для описания ситуации, при которой люди активно внедряют новые технологии в собственную повседневную жизнь и профессиональную деятельность при отсутствии полного понимания и знаний принципов их работы. Следствием данной информационной асимметрии становится возможность спекуляции и сокрытия отдельных деталей об особенностях и свойствах технологических устройств, что, например, отражено в сборе «умными колонками» от компании «Эмэзэн» (Amazon) широкого спектра данных о пользователе.

В условиях цифровой трансформации сохранность и использование персональных данных становятся одним из основных предметов беспокойства и опасений населения и экспертного сообщества [15-17]: несанкционированный доступ к данным и непредсказуемые выводы, которые можно сделать на основе их анализа, рассматриваются как ключевые угрозы. По этим причинам становится реальным развитие «воронки недоверия», которую можно представить в виде следующей схемы: наличие и рост интеллектуального долга; опасность отчуждения персональных данных и их использование в обход человека, включая политические цели и манипулирование; недоверие к политическим организациям, кандидатам и институтам, использующим анализ данных; недоверие к технологиям и частичный отказ от них как средство сокращения интеллектуального долга/использование технологий как инструмента сопротивления экспансии институтам контроля и регулирования. Опыт недавних протестов в Гонконге продемонстрировал возможность адаптации и использования цифровых технологий в противовес государственным структурам.

3.2. Размывание демократических принципов.

Размывание демократических институтов и механизмов плебисцитарной демократии. Распространение нацеленной политической агитации на основе моделирования личности исходя из ее поведения в социальных сетях стали инструментами воздействия на потенциальный выбор избирателя, что дискредитирует ключевые положения плебисцитарной демократии. В этом отношении следует констатировать рост уязвимости выбора человека, так как микротаргетинг позволяет смоделировать его решение и поведение с последующим информационным воздействием: успех «информационного заражения» избирателей в президентской кампании Д. Трампа и участников референдума по членству Великобритании в ЕС стали причиной роста дискуссий о будущем механизма плебисцитарной демократии.

3.3. Конфиденциальность личных данных.

Проблема конфиденциальности и сохранения анонимности персональных данных. Современные исследования демонстрируют возможность точной идентификации пользователя на основании анонимных данных, размещенных в публичном доступе [18]. В техническом измерении это требует создания кросс-секторального массива анонимных данных, включающего, как минимум, 15 параметров информации о человеке (пол, почтовый индекс, дата рождения, группа крови и т.д.): при анализе 15 категорий «безымянных» анонимных данных с помощью генеративных моделей и алгоритмов машинного обучения можно идентифицировать человека с точностью до 99,8% при охвате 100% населения США, или 99,6% — при охвате 1% населения.

3.4. Когнитивные ограничения алгоритмов.

Когнитивные ограничения алгоритмов и последствия решений, принятых на основе их результатов. Действия алгоритмов имеют когнитивные ограничения и допускают игнорирование отдельных аспектов ситуации [19, 20], поэтому внедрение в алгоритм ошибочных связей может исказить итоговые результаты и привести к непредвиденным последствиям. Это используется как аргумент в пользу противодействия внедрению алгоритмов в политические процессы и избегания избирательного использования анализа данных — «нассилие данных» (data violence): к примеру, в Чикаго в алгоритмы машинного обучения, разработанные для отслеживания криминальной активности и распределения полицейских групп среди городских кварталов, была включена предпосылка о наличии взаимосвязи между тем, какой расы/национальности большинство проживающих в квартале и количеством преступлений в нем, что привело к росту полицейского надзора за конкретными этническими группами [21].

Предупреждение и нивелирование данных рисков становится возможным через развитие институциональной базы — законодательное регулирование сбора и использования персональных данных пользователей, а также через развитие человеческого капитала — совершенствование навыков использования современных технологий, которые позволяют сократить асимметрию информации между пользователями и разработчиками, получить базовые знания о защите персональных данных. Принятие в ЕС «Общего регламента по защите данных» в 2017 г. отражает необходимость участия политических институтов в законодательном регулировании и формировании этики использования персональных данных пользователей.

5. Заключение.

Таким образом, в настоящий момент можно наблюдать внедрение технологий больших данных в политические процессы, что обусловлено возможностями поиска ранее неочевидных взаимосвязей для совершенствования качества прогнозов и управления. Несмотря на указанные преимущества, опыт использования микротаргетинга в избирательных кампаниях продемонстрировал горизонт допустимых действий с точки зрения социальных ожиданий и одобрения: на первый план выходят различные политические риски, связанные с конфиденциальностью персональных данных, ростом ресурсов контроля и манипулирования, последствиями когнитивных ограничений алгоритмов. Как следствие, на международном и национальном уровнях следует ожидать инициирования процессов переговоров и согласования интересов различных сторон в вопросе законодательного регулирования сферы использования пользовательских данных, — уже в настоящий момент можно идентифицировать линии конфликтов и противоречий основных участников в лице национальных государств, технологических компаний (включая технологических гигантов), коммерческих организаций, криминальных структур, институтов гражданского общества.

6. Список литературы.

1. Scott J. Two Cheers for Anarchism: Six Easy Pieces on Autonomy, Dignity and Meaningful Work and Play. Princeton University Press; 2012.

2. Rifkin J. The Zero Marginal Cost Society: The Internet of Things, the collaborative commons, and the eclipse of capitalism. Palgrave Macmillan; 2014.

3. Thaler R., Sunstein C. Nudge: Improving Decisions about Health, Wealth and Happiness. Yale University Press; 2008.

4. Kollmuss A., Agyeman J. Mind the Gap: Why do people act environmentally and what are the barriers to pro-environmental behavior? Environmental Education Research. 2002;8(3):239-260.

5. Lanham R. The Economics of Attention. Style and Substance in the Age of Information. Chicago: Chicago University Press; 2006.

6. Venturini T., Rogers R. "API-Based Research" or How can Digital Sociology and Journalism Studies Learn from the Facebook and Cambridge Analytica Data Breach. Digital Journalism. 2019;7(40):532-540.

7. Bruns A. After the "APIcalypse": social media platforms and their fight against critical scholarly research. Information Communication and Society. 2019;22(2):1-23.

8. Jan F., Valikoski T-R., Grau J. Listening in the Business Context: Reviewing the State of Research. The International Journal of Listening. 2008;22(2):141-151.

9. Deulkar D., Gupta P. A Study on Usage of Online Personal Information by Data Brokers. International Research Journal of Engineering and Technology. 2018;5(5):3522-3527.

10. Golbeck J., Robles C., Edmondson M., Turner K. Predicting personality from Twitter. IEEE International Conference on Social Computing; 2011.

11. Ouercia D., Lambiotte R., Stillwell D., Kosinski M., Crowcroft J. The personality of popular Facebook users. Proceedings of the ACM 2012 conference on computer supported cooperative work; 2012.

12. Segalin C., Perina A., Cristani M., Vinciarelli A. The pictures we like are our image: continuous mapping of favorite pictures into self-assessed and attributed personality traits. IEEE Trans Affect Comput. 2017;8(2):268-285.

13. Kramer A. D., Guillory J. E., Hancock J. T. Experimental evidence of massive-scale emotional contagion through social networks. Proceedings of the National Academy of Science of the USA. 2014;111(24):8788-8790.

14. Fording R., Schram S. The Cognitive and Emotional Sources of Trump Support: The Case of Low-Information Voters. New Political Science. 2017;39(4):670-686.

15. Мухаметов Д. Р. Проблемы и перспективы реализации концепции «Умный город» в России (на примере Москвы). Мир новой экономики. 2019;13(3):81-88.

16. Ерохина О. В. «Умная Москва»: новая концепция развития столицы. Гуманитарные науки. Вестник Финансового университета. 2018;8(3):6-10.

17. Pentland A. Social Physics: How Good Ideas Spread — The Lessons from a New Science. New York: The Penguin Press; 2014.

18. Rocher L., Hendrickx J., de Montjoye Y.-A. Estimating the success of re-identifications in incomplete datasets using generative models. Nature Communications. 2019;10(1):145-171.

19. O'Neil С. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. N.Y.: Crown Books; 2016.

20. Pasquale F. The black box society: The secret algorithms that control money and information. Cambridge: Harvard University Press; 2015.

21. Гринфилд А. Радикальные технологии: устройство повседневной жизни. М.: Издательский дом «Дело»; 2018.

***

C небольшими редакторскими правками.
Оригинал: Мухаметов Д. Р. Технологии big data в политических процессах: возможности и риски. Гуманитарные науки. Вестник Финансового университета. (2019)
Статья подготовлена по результатам исследований, выполненных за счет бюджетных средств по государственному заданию Финансовому университету при Правительстве РФ .