Звоним ли мы по телефону, читаем ли электронную почту, достаем ли карту клиента во время покупки или знакомимся в Интернете - мы производим данные, огромные объемы данных везде. Они могут быть проанализированы и оценены с помощью специального программного обеспечения и алгоритмов. Особенностью большого объема данных является то, что это захватывает не только настоящее. Можно также делать прогнозы на будущее.
Данные - это сырье будущего.
Где сейчас шторм? Где распространяется малярия? Какие симптомы указывают на то, что недоношему ребенку вскоре станет еще хуже? Как рассчитывается стоимость компании? И еще много разных вопросов мы ищем в интернете. Система Данных может помочь создать возможность раннего предупреждения или понять процессы и сделать их более эффективными.
Секретные службы, банки, телекоммуникационные службы, компании и научные исследования, страховые компании и кредитные агентства - все они надеются на сырье будущего - большой объем данных . Чем подробнее компания знает своих клиентов, тем больше будут стимулы к покупке или же могут быть разработаны новые услуги.
Компании уже знают больше, чем хотелось бы многим - они видят наперед. Например, розничная сеть в США определила, какие потребители вероятнее всего находятся в ожидании малыша и разместила для них целенаправленную рекламу.
Цифровизация позволяет проводить анализ данных о большом количестве информации.
Большие данные относительно новые: только ускоренная цифровизация позволяет собирать, хранить и связывать данные в массовом масштабе. Об этом свидетельствует количество информации, которая в настоящее время хранится на серверах по всему миру:
- Только за последние пять лет было собрано более 90% всего массива данных. По оценкам экспертов, гора данных в пять миллиардов гигабайт в настоящее время добавляется каждые десять минут.
Многие компании и органы власти буквально тонут в потоке данных. Зачастую они еще не в состоянии оценить или использовать их. Но это, скорее всего, скоро изменится.
Появляются "стеклянные люди".
Где люди передвигаются, с кем встречаются, что любят есть и кто находится рядом с ними - все это теперь можно поймать легче, чем когда-либо прежде.
Это делает их уязвимыми, появляются "стеклянные люди". Благодаря разоблачениям бывшего сотрудника спецслужб Эдварда Сноудена стало известно, какие массы только на телекоммуникационных данных американская спецслужба хранит и зачитывает по всему миру. Владение данными означает власть.
Взрывной момент в большом объеме данных заключается в том, что большая их часть может быть присвоена отдельным лицам - даже если запись данных была зашифрована.
Часто, достаточно лишь нескольких деталей, таких как возраст, пол и почтовый индекс или медицинский диагноз, лечащий врач и место жительства.
Благодаря идентификации устройств в смартфонах, файлах cookie и IP-адресах секретные службы и компании точно знают, с кем они имеют дело.
Другая проблема заключается в том, что прогнозы на будущее, сделанные с помощью большого количества данных, не обязательно должны быть верными. Например, поведение человека или такие категории, как происхождение и религия, могут быть использованы для определения того, кто может совершить преступление в будущем.
Это звучит как научная фантастика, но это уже сегодня реальность. С помощью баз данных и различных источников, государства решают, кто может въехать в страну, а кто должен оставаться за ее пределами.
Человеческое поведение становится предсказуемым.
Чем больше данных, тем больше вероятность того, что они будут использованы не по назначению.
Поэтому, те кто их защищает предупреждают о неправомерном использовании данных и потере контроля. "Если мы храним большое количество данных, это делает нас доступными для манипулирования и шантажа", - говорит Паделуун из ассоциации по защите данных Digitalcourage.
Кроме того, собранные данные всегда могут быть использованы не по назначению или взломаны: "Безопасны только те данные, которые не были собраны", подчеркивает Паделуун.
Прозрачность, которую большой объем данных может создать, также односторонняя. Многое становится видимым для тех, кто собирает эти данные. А у людей, чьи данные собираются, почти никто не просит разрешения. Часто они ничего об этом не знают.