Наверное ни для кого не секрет, что сайты которые мы посещаем в сети интернет собирают данные о пользователе. Если вы хотите узнать, какие данные собирает о вас тот или иной сайт, можно воспользоваться специальными сервисами предназначенными для этого. И один из этих сервисов Blacklight (https://themarkup.org/blacklight ). Пользоваться им довольно просто. Нужно ввести в специальное поле адрес сайта и нажать на кнопку сканирования, после чего вы получите кучу самой разнообразной информации. Здесь можно узнать о том, какие технологии слежения за пользователями используются, а также о том, куда могут утекать ваши данные. Так же доступна информация о рекламных трекерах, отслеживании мыши, кликов и скроллинга. Ну и конечно же, сетевую активность. Вдобавок будет получена информация о наличии на сайте кейлоггеров и отслеживающих пикселей. Давайте посмотрим, как пользоваться данным сайтом и какую информация он предоставляет. Единственный минус данного сайта для русскоязычного пользователя в том, что он на английском языке. Впрочем, при использовании переводчика все довольно понятно. Итак, давайте приступим и посмотрим, какие технологии слежения использует Яндекс.Дзен.
Заходим на сервис Blacklight, вводим адрес сайта, жмем кнопку «Scan Site » и ждем окончания сканирования. Это происходит достаточно быстро, так что, ждать долго не придется.
Что ж, результаты сканирования получены и давайте посмотрим, что использует, а что нет Яндекс.Дзен, прямо по порядку результатов сканирования.
Первая строка: No ad trackers found on this site (На этом сайте нет рекламных трекеров). Как видим, рекламных трекеров Дзен не использует.
Вторая строка: Third-party cookies not found (Сторонние файлы cookie не найдены). Так же на Дзене не используются куки посторонних сайтов.
Третья строка: Tracking that evades cookie blockers wasn 't found (Отслеживание, которое уклоняется от блокировщиков файлов cookie , не было найдено). Здесь тоже все в порядке.
Четвертая строка: This website could be monitoring your keystrokes and mouse click (Этот сайт может следить за вашими нажатиями клавиш и щелчками мыши). А вот тут уже интереснее. Данная технология используется в Яндекс.Метрике. По опыту скажу, что можно посмотреть, как пользователь проводил время на сайте. Куда нажимал и как скроллил страницу. Это так называемы тепловизор. Давайте развернем более подробное описание и переведем то, что там написано:
Blacklight detected the use of a session recorder, which tracks user mouse movement, clicks, taps, scrolls, or even network activity. This data is compiled into videos and heat maps that website owners can watch to see how users interact with the site. Research has shown these practices can be insecure and make sensitive user data such as passwords and credit card information more vulnerable to leaks. This technique was used by fifteen percent of popular websites when we scanned them in September 2020.
Blacklight detected a script belonging to the company Yandex LLC doing this on this site.
However...
While Blacklight can detect whether a session recorder was loaded, it cannot determine exactly how the collected data is being used.
Перевод: Blacklight обнаружил использование регистратора сеансов, который отслеживает движение мыши пользователя, щелчки, нажатия, прокрутки или даже сетевую активность. Эти данные собираются в виде видео и тепловых карт, которые владельцы веб-сайтов могут смотреть, чтобы увидеть, как пользователи взаимодействуют с сайтом. Исследования показали, что эти методы могут быть небезопасными и сделать конфиденциальные пользовательские данные, такие как пароли и информация о кредитных картах, более уязвимыми для утечек. Этот метод использовался пятнадцатью процентами популярных веб - сайтов, когда мы сканировали их в сентябре 2020 года.
Blacklight обнаружил скрипт, принадлежащий компании Yandex LLC, делающей это на этом сайте.
Однако...
Хотя Blacklight может определить, был ли загружен регистратор сеансов, он не может точно определить, как используются собранные данные.
В принципе, достаточно понятно, что Яндекс собирает данные, которые потом используются в аналитике посещаемости и прочих параметрах. Это позволяет веб-мастерам более точно определять, как пользователи взаимодействуют с их сайтом.
Пятая строка: We did not find this website capturing keystrokes (Мы не нашли на этом сайте фиксации нажатия клавиш (кейлоггера)).
Шестая строка: Facebook Pixel not found on this website (Пиксель Facebook не найден на этом сайте).
Седьмая строка: Google Analytics "remarketing audiences " feature not found (Функция Google Analytics "ремаркетинг аудитории" не найдена).
Таким образом, мы узнали, что Яндекс.Дзен использует Тепловизор для отслеживания движений мыши, скроллинга страниц и нажатия на определенные элементы в статьях.
Можно для примера проверить еще какой-либо сайт. Давайте выберем сайт на компьютерную тематику. К примеру: https://overclockers.ru/ .
Как видим, здесь уже все немного печальнее. При сканировании было обнаружено аж 8 рекламных трекеров. Взглянем, что же здесь используется:
Веб-сайты, содержащие технологию отслеживания рекламы, загружают Javascript-код или небольшие невидимые изображения, которые используются либо для создания вашего рекламного профиля, либо для идентификации вас для таргетинга рекламы на этом сайте. Эти методы часто используются в дополнение к файлам cookie для профилирования вас.
Blacklight обнаружил на этой странице трекеры, отправляющие данные компаниям, занимающимся онлайн-рекламой. Blacklight обнаружил скрипты, принадлежащие ООО "ЭКО ПК - Комплексные решения", ООО "Яндекс" и двум другим компаниям.
Так же здесь были обнаружены куки, которые принадлежат сторонним компаниям:
Они обычно используются рекламными трекинговыми компаниями для профилирования вас на основе вашего использования Интернета.
Blacklight обнаружила 3 сторонних файла cookie на этом сайте. Blacklight обнаружила файлы cookie, установленные для Alphabet, Inc. и ООО "ЭКО ПК - Комплексные решения".
Blacklight обнаружил использование регистратора сеансов, который отслеживает движение мыши пользователя, щелчки, нажатия, прокрутки или даже сетевую активность. Эти данные собираются в виде видео и тепловых карт, которые владельцы веб-сайтов могут смотреть, чтобы увидеть, как пользователи взаимодействуют с сайтом. Исследования показали, что эти методы могут быть небезопасными и сделать конфиденциальные пользовательские данные, такие как пароли и информация о кредитных картах, более уязвимыми для утечек. Этот метод использовался пятнадцатью процентами популярных веб-сайтов, когда мы сканировали их в сентябре 2020 года.
Blacklight обнаружил скрипт, принадлежащий компании Yandex LLC, делающей это на этом сайте.
Однако...
Хотя Blacklight может определить, был ли загружен регистратор сеансов, он не может точно определить, как используются собранные данные.
Ну и по классике, скрипт, отслеживающий мышь и прочее от Яндекс.Метрики.
Ну и конечно же, здесь присутствует скрипт от Google :
Этот сайт использует Google Analytics и, похоже, использует свою функцию ”ремаркетинг аудитории”, которая позволяет отслеживать пользователей для целевой рекламы в Интернете. Эта функция позволяет веб-сайту создавать собственные аудитории на основе того, как пользователь взаимодействует с этим конкретным сайтом, а затем следить за этими пользователями через Интернет и таргетировать их с помощью рекламы на других сайтах с помощью Google Ads и Display & Video 360. Представитель Google сказал Разметке, что операторы сайтов должны информировать посетителей, когда данные, собранные с помощью этой функции, используются для связи этих данных просмотра с чьей-то реальной личностью. Вы знаете, когда эти туфли, на которые вы смотрели, следовали за вами по всему Интернету? Это один из следопытов, ведущих к этому. Эта функция появилась в пятидесяти процентах популярных веб-сайтов, когда мы сканировали их в сентябре 2020 года.
Вот такой вот достаточно полезный сайт, который поможет вам узнать, какие данные собирает о вас сайт при посещении его страниц. К сожалению, в наш век компьютерных технологий о полной конфиденциальности можно только лишь мечтать.
Надеюсь, что данная статья была вам интересна и полезна.
Спасибо за внимание!