Найти тему
Агент Паранойи

Big Data. Наш Большой брат?

Big Data уверенно шагает по миру: крупные компании всюду стараются внедрить машинное обучение, самообучающиеся нейросети, имитационное моделирование и много других интересных штук.

На всякий случай, для тех кто в совсем уж глухом танке, Big Data — это подходы, методы и инструменты для обработки как структурированных, так и неструктурированных данных. Казалось бы, ничего нового. За тем исключением, что объём этих данных настолько огромен, что привычными методами их изучить если и можно, то крайне сомнительно с практической точки зрения.

-2

Штука полезная, спору нет. Вспомнить хотя бы кейс “Сбербанка”, когда они смогли внедрить систему анализа фотографий и идентификации клиента банка, что позволило уменьшить случаи мошенничества почти в 10 раз. Или “Билайн”, который сегментирует свои базы данных и защищает своих клиентов от денежных махинаций.

Однако, год уже подарил нам целых два случая, когда подходы Big Data использовались не просто во вред гражданам, а реализовывали буквально злодейский план из диснеевских мультиков. Расскажем об обоих подробнее.

Китайская антиутопия.

Кто внимательно следит за нашим telegram-каналом, тот знает, что в Китае активно и результативно вводят систему социального кредита. Система оценки напоминает обычный банковский, только вместо финансовых показателей фиксируется социальный. При этом часто весьма криво. Любит какой-нибудь гипотетический китаец вечером позависать в интернете? Пожалуйста, безответственный гражданин, с такого и баллы можно снять.

-3

Полностью система будет введена в 2020 году, но уже сейчас есть первые ласточки “светлого будущего”. 1 мая 2018 года лицам с низким социальным кредитом не смогут путешествовать за границу или внутри страны. Всё это дело реализовано будет очень просто: таким гражданам просто будет недоступна покупка билета.

Предполагает ли система хоть какие-то бонусы? В целом, да. Например, возможность устроить детей в хорошую школу или получение престижной работы. Ну или вот, со свежими законами, возможность спокойно перемещаться по стране. Система пока все ещё обкатывается, но уже запущена в нескольких городах. К примеру, в Жунчэне все 670 тыс жителей уже живут в мире социального кредита.

-4

Интересно то, что система социального кредитования уже несколько лет “обкатывается” в Китае на бизнесе: с помощью Big Data, компании оцениваются по финансовым отчетам на соответствие трудовым, юридическим и экологическим нормам. Компании с хорошими оценками получают расширенные возможности для кредитования, привлечение инвестиций, а также пониженные налоги. С плохими оценками, соответственно, наоборот.

Увидеть, как система социального кредитования изменит Китай мы сможем разве что через пару лет. Только в 2020 году система будет введена полностью и можно будет сделать выводы. Но что забавно, китайские блоггеры уже сейчас хвалят систему, подчеркивая её плюсы и тот факт, что “жить по правилам” не так уж и сложно. Видимо заранее себе уже нарабатывают социальный кредит.

-5

От самой системы, очевидно, не спастись. Данные поступают отовсюду: государственные службы, уличные камеры, провайдеры, владельцы самых популярных приложений в Китае и так далее. Ко всему этому делу подключается Big Data и искусственный интеллект решает насколько вы достойный гражданин.

Здоров, не правда ли? А завершает картину проект, над которым сейчас работает Китай. Суть заключается в том, чтобы спрогнозировать действия пользователя. Но тут они немного опоздали, а мы спешим рассказать вам о секретной программе из США.

Есть в США такая компания, Palantir Technologies. Компания, кстати, немаленькая — в 2016 году она считалась четвертым по капитализации стартапом в мире. Палантир специализируется как раз на Big Data. Компания известна, например, борьбой с wikiLeaks при использовании дезинформации и атаки на сервера. Но больше всего Палантир интересен своими заказчиками: полицейские департаменты, ЦРУ, армия США. Считается, что большую часть своих средств Palantir Technologies получает не от правоохранительных органов, а от коммерческих заказов.

Палантир получил большую известность сейчас, в 2018 году, в результате новости о том, что Новый Орлеан не собирается продлять контракт с этой компанией. Как оказалось, в этом и было самое интересное — о контракте с Палантиром широкая общественность не знала. И сейчас мы объясним почему это важно.

С 2012 по 2018 год в Новом Орлеане работала система Палантир от Palantir Technologies (обычно с неймингом у них получше). Система была создана для анализа публикаций в соцсетях и мессенджерах, чтобы на основе этого пласта данных спрогнозировать личность будущего преступника и вероятность преступления. Вы только вдумайтесь: на деньги ЦРУ была сделана программа, которая без зазрения совести анализировала данные граждан. И об этом никто не знал, кроме департамента полиции! Никакого официального подтверждения не было получено.

Таким образом:

  • Официально Палантир никогда не значился в документах и полицейские не строили на нём свою законодательную базу.
  • Адвокаты могли разве что слышать городские легенды о цифровом чудо-предсказателе.
  • Палантир никогда не фигурировал в материалах дела.

И всё бы ничего, если бы по результатам действия системы люди не отправлялись в суд. Ронал Сепарс, возглавляющий полицию Нового Орлеана с 2010 по 2014 год, подтвердил, что многие городские гангстеры были схвачены именно с использованием Палантира. Он называет такие известные банды, как 3NG, 39ers, 110ers.

Есть и другие официальные данные, связанные с системами прогнозирования преступлений. Чикагская полиция заявляет, что в 2016 году три из четырех жертв были в “горячем списке” системы. И 80% виновников преступления также система указывала, как потенциальных преступников. Американский стратегический исследовательский центр RAND в своём отчете указывает, что в целом системы прогнозирования работают, но далеко не всегда преступление можно предотвратить, даже если спрогнозированы все участники. Неизвестно, применялся ли именно Палантир в Чикаго — с 2009 года Национальный институт правосудия начал выпуск грантов для пилотных проектов по прогнозированию преступности. Вполне возможно, что это другая система, но принцип работы у них один и тот же.

Кстати, ещё пара слов об эффективности. В Чикаго с помощью прогнозирования смогли предотвратить до двух убийств в год, что составляет меньше 1% от общего уровня. Чтобы добиться снижения преступности хотя бы на 5% нужен огромный скачок как в способности прогнозировать и анализировать, так и в эффективности вмешательства.

Что в итоге?

Чаще всего Big Data используется для того, чтобы как-то облегчить жизнь людей. В идее всегда лежат благие намерения, которые в перспективе сделают гражданам хорошо и надолго.

Но рассмотрим два наших кейса:

  • Китай хочет смотивировать людей быть “идеальными гражданами”, упуская тот нюанс, что идеальных людей особо и нет. Более того, совершенно непонятно как быть тем, кто в китайскую картину мира не вписывается. Правительство даже не стесняется прямо говорить, что люди с низким социальным кредитом и шагу ступить не должны. Добавьте сюда бонусы за доносительство и вуаля: пряник для поощрения быстро становится кнутом для наказания.
  • А Америка? Все мы хотим жить в мире без преступности. Но стоило ли давать свет Палантиру? Система оказалась действительно рабочей, но неэффективной. И ведь одним из проблемных моментов называют слабое реагирование. Так может стоит начать с более качественной подготовки офицеров, а не лезть в личную жизнь граждан и искать преступника под каждой кроватью?

Как часто и бывает, хорошие идеи губит отвратительная реализация. Но первый звонок давно отзвенел: в череде проектов Big Data под ритуальный нож отправлена приватность. И мы, как опытные параноики, с нетерпением будем ждать, чем ответят организации, которые верят в право людей на конфиденциальность.

Всем хорошего дня и избегайте скачивания мемов про партию на территории Китая.