Как вы знаете, сейчас ограничивают возможность звонков в WhatsApp и Telegram. Официальная версия такова, что делается это под эгидой борьбы с мошенниками. Хотя около половины трафика мошенников проходит через обычные звонки. Текущее замедление звонков аналогично замедлению ютуба — когда в VK Видео вбухали тонну ресурсов, а сервис оказался никому не нужным. Поэтому, пользуясь близостью к государству, VK, скорее всего, пролоббировало замедление ютуба, в надежде, что пользователи перетекут в сервисы VK. С мессенджером Макс аналогичная ситуация. Сразу скажу, что подобные неспортивные методы конкурентной борьбы я считаю плохими, потому что без конкуренции не будет хорошего продукта. Плюс не красиво со стороны государства держать граждан за идиотов: вместо того, что бы честно сказать — приходите в наш продукт, начинается дурацкая реклама со связью на парковке и оправданиями, что все это сделано ради безопасности граждан. Сейчас на просторах интернета идет много разгона про то, что мессенджер Макс собирает всю информацию о пользователях, и все мы будем под цифровым колпаком. Поэтому давайте я расскажу, какие данные собирают частные компании о своих пользователях, и как это дальше используется.
Прежде всего, в том, что я пишу — нет никаких секретов. Все можно найти в открытом доступе, никаких тайных секретов я не рассказываю. Про способы сбора данных и методы их обработки я знаю, потому что работаю аналитиком данных. Более того, один из моих больших проектов, над которым я работал больше года — это как раз выстроить процесс сбора данных о пользователях в одном из сервисов.
Первое. Данные сейчас собирают все. Ваш мобильный телефон; сайты, на которые вы заходите с компьютера или телефона; приложения на мобильном телефоне; карты лояльности; то, что вы кликаете на кассах самообслуживания — все это является источником данных и собирается. Даже сайт с локальной пиццерии, где нет штата айтишников, может собирать информацию о вас. Никаких сложных систем для этого писать не нужно. Уже есть готовые решения, системы автоматического сбора данных, например, Google.Analytics / Firebase / Яндекс.Метрика / Яндекс.Аппметрика. Что бы начать собирать данные о пользователях с сайтов / мобильных приложений, не нужно ничего сложного делать. Достаточно добавить в код несколько строчек, с чем справится начинающих программист.
Второе. Собирается больше, чем вы можете представить. Приложения даже когда у телефона заблокирован экран могут отправлять логи (записи о действиях пользователя) на сервер. Собирается информация о том:
- что вы видели в приложении
- куда вы кликали
- id девайса
- номер телефона
- все, что было указано в персональных данных (адреса / номера телефонов)
- состояние вашей батареи
- модель телефона
- текущая операционная система
- ip-адрес
- геолокация
и куча всего еще
Третье. Режим инкогнито не спасает. Он поможет скрыть посещения сайтов в истории браузера. Провайдер будет видеть, какие сайты вы посещаете. И сайты / приложения смогут вас идентифицировать, даже если вы зашли туда незалогиненным
Четвертое. Данные обрабатывают, что бы узнать о вас даже то, что вы не указали. Например, когда я покупал продвижение блога на дзене, мне предлагалось выбрать сегменты аудитории / возраст / пол / интересы. Откуда у IT-компаний эта информация? Есть несколько способов узнать это:
1. Какую-то информацию вы можете указать напрямую в своем профиле, или залогинившись через Госуслуги (в этом случае часть данных будет собрана с Госуслуг)
2. По вашему поведению (куда кликаете / что пишете в поисковых запросах / что пишете в сообщениях). Например, вы чаще кликаете в Дзене на статьи про инвестиции, и не кликаете на статьи с описанием банкротств. Это позволяет сделать выводы, что кредиты вам не интересны, а интересны инвестиции.
3. По сравнению с другими пользователями. Система может предсказать ваши характеристики (например, примерный уровень дохода, наличие детей, тип автомобиля) не потому что вы об этом сказали, а потому что люди с тем же поведенческим профилем часто обладают этими характеристиками
На самом деле, я привел самые наглядные примеры. Под капотом все намного сложнее
Ну а теперь к хорошим новостям
Во-первых, большинство данных не используются. Собирать данные просто и дешево, потому что один раз настроил и забыл (а жесткие диски для хранения стоят дешево). Их собирают по принципу «на всякий случай, пусть будет». Что дорого, так это обработка данных. Каждая гипотеза, которая возникает; каждый аналитический алгоритм требует ручной обработки.
Во-вторых, все упирается в деньги. Компании собирают данные о пользователях в первую очередь, чтобы больше зарабатывать. Если создание алгоритма по определению интересов пользователей будет стоить больше, чем то количество денег, которое с его помощью можно будет заработать — его не будут делать
В-третьих, компании занимаются сбором данных не потому, что мы живем в антиутопии, и они — корпорации зла, а опять-таки, ради денег. Чем лучше компании знают своих пользователей, тем больше это позволит заработать денег. Никто не проводит исследования пользователей просто ради академического интереса, всегда всё упирается в деньги.
В-четвертых, исходя из написанного выше, на какой-то продвинутой сбор данных (что бы знать ваши интересы / уровень дохода / возраст) ресурсы и данные есть только у самых крупных компаний. Компании поменьше довольствуются просто анализом кликов и просмотра страниц
В заключение, отмечу, что данные собирают все, но их основная частных компаний – не тотальный контроль или вторжение в личную жизнь ради самого вторжения, а извлечение коммерческой выгоды. Будет интересно посмотреть, что с нашими данными будет делать государство, особенно учитывая недавние шаги под предлогом «безопасности» и продвижения собственных сервисов вроде Макса.