Добавить в корзинуПозвонить
Найти в Дзене

Big Data (Большие данные)

Небольшие размышления о больших данных. Что такое "Большие данные?" Big Data - это огромные массивы цифровых данных, собранные различными способами, обработанные по определенным признакам и в последствии подвергнутые определенному анализу. Данное направление стало активно набирать обороты около 20 лет назад в процессе взрывного роста объемов цифровой информации в мире. За последнее десятилетие объем цифровой информации растет практически в геометрической прогрессии и речь идет не только о привычном для всех "медиа контенте" - текстовой, звуковой или видео информации, происходит сбор множества данных, о которых вы даже можете не подозревать.... О вас могут знать больше, чем вы знаете о себе Если вы активно пользуетесь современными устройствами и технологиями - спешу вас огорчить, о вас знают очень много. Вы скорее всего уже забыли, что год назад сели на метро в полдень, проехали три остановки, купили кофе, погуляли по парку, прослушали в наушниках два любимых трека, встретились с друг
Оглавление

Небольшие размышления о больших данных.

Что такое "Большие данные?"

Big Data - это огромные массивы цифровых данных, собранные различными способами, обработанные по определенным признакам и в последствии подвергнутые определенному анализу. Данное направление стало активно набирать обороты около 20 лет назад в процессе взрывного роста объемов цифровой информации в мире. За последнее десятилетие объем цифровой информации растет практически в геометрической прогрессии и речь идет не только о привычном для всех "медиа контенте" - текстовой, звуковой или видео информации, происходит сбор множества данных, о которых вы даже можете не подозревать....

-2

О вас могут знать больше, чем вы знаете о себе

Если вы активно пользуетесь современными устройствами и технологиями - спешу вас огорчить, о вас знают очень много. Вы скорее всего уже забыли, что год назад сели на метро в полдень, проехали три остановки, купили кофе, погуляли по парку, прослушали в наушниках два любимых трека, встретились с другом, посидели в кофейне, заказали круассан и небольшой чайничек чая, затем заказали такси, поехали домой, заплатили за такси 563 рубля, потом вечером сидели в интернете, смотрели различные гостиницы и билеты на самолеты - одним словом планировали предстоящий отпуск.

Так вот, этот ваш день уже скорее всего стерся в вашей памяти, остались возможно лишь самые яркие моменты, но вот только цифровые системы помнят все: время когда вы "пикнули" картой турникет в метро, номер поезда, который вас вез, камера на выходе в метро зафиксировала ваше лицо, затем банк зафиксировал транзакцию по вашей карте при покупке кофе, плеер в телефоне сохранил и вероятно отправил название треков, которые вы послушали, телефон передал вашу геопозицию, затем траты в кофейне также зафиксированы, как и маршрут в такси и стоимость проезда, далее у вас дома, в вашем компьютере, посещение сайтов, просмотр гостиницы, билетов и т. д.... Всё это было зафиксировано и сохранено в различных информационных системах, с которыми вы взаимодействовали. И так каждый день, про всех людей, кто так или иначе взаимодействует с различными системами. Это огромные массивы данных, которые представляют собой определенную ценность!

Примерно в таких DATA-центрах происходит хранение и обработка "больших данных"
Примерно в таких DATA-центрах происходит хранение и обработка "больших данных"

Зачем собирают эти массивы данных и стоит ли этого опасаться?

Немного успокою, конкретно ваша персона не представляет особого интереса для тех, кто собирает эти данные (если конечно вы не находитесь в Федеральном розыске)), максимум конкретно вы интересны как потребитель, данные о вас это лишь кирпичик или ячейка среди множества таких же, собранных с других людей, но вот в совокупности эти массивы данных могут представлять определенный интерес. Основная цель - статистика и аналитика. Сбор данных происходит как минимум для статистического учета (покупок, заказов, потока клиентов и тд), и для различного анализа этих данных, с целью построения прогнозов или выявления особенностей поведения или различных предпочтений пользователя. Самое простое и практичное применение - проанализировать и понять ваши предпочтения и предложить вам рекламу, соответствующую вашим интересам. Так происходит довольно точное сегментирование целевой аудитории и эта реклама достигает довольно высокой эффективности (откуда думаете столько денег у Фейсбука, Ютуба, Гугла и даже... Дзена). Есть еще и масса других целей сбора больших данных, но об этом позже...

По поводу опасений - если не страдаете манией преследования и не беспокоитесь о том, что некоторые компании слишком много о вас знают, то бояться в общем-то нечего. Лично меня это никаким образом не беспокоит, однако некоторых людей сама суть может иногда напрягать... Особенно, если с кем-то разговариваешь, к примеру, об автомобилях и через некоторое время тебе приходит на эту тему реклама... Не берусь точно утверждать, но смартфонам ничего не мешает иногда подслушать или подсмотреть. Но если все это как-то можно избежать: смартфоном можно не пользоваться, персональные данные нигде не оставлять и не давать согласие на их обработку, расплачиваться наличными, но вот с камерами видеонаблюдения в общественных местах и распознаванием лиц уже сложнее. Хотя опять же, если вам есть что скрывать...

Примерно так современные системы распознают лица людей с большой точностью
Примерно так современные системы распознают лица людей с большой точностью

В целом: легче принять это как факт современной цифровой жизни и жить дальше с этим. Не так страшно, что за вами наблюдают и просто фиксируют ваши действия, гораздо большую опасность представляют утечки по настоящему "персональных" данных, и то, что многие по незнанию (или иным причинам) добровольно и самостоятельно сообщают не совсем дружелюбно настроенным лицам свою важную персональную информацию. Хотя просто владеть информацией это еще пол дела, гораздо важнее то, как ее анализировать, к каким выводам приходить и как впоследствии использовать.