Добавить в корзинуПозвонить
Найти в Дзене
SMM Blog

Причины попадания непубличных данных в поисковые системы: как избежать утечки

Как показывает практика, многие компании выкладывают немалые деньги за то, чтобы их сайты находились на топовых позициях в поисковых системах Интернета. Но эксперты информационных технологий обратили внимание на то, что сразу после попадания файлов Google Docs в выдачу Yandex, фирмы стараются сделать все возможное, чтобы страницы с личными данными не попали в поисковую выдачу. В чем причина таких действий? Сегодня расскажем все об утечках личной информации в Интернете, а также о том, как этого избежать. Зона риска: какая персональная информация может оказаться в поисковых системах и причины этого явления На самом деле утечки непубличной информации в поисковые системы происходят регулярно по всему миру. Грешат этим всевозможные онлайн-магазины, банковские организация, государственные структуры, различные сервисы и т.д. Приведем конкретный пример: в 2017-м поисковик Гугл проиндексировал тексты, которые люди перевели при помощи облачного ресурса Translate.com. Это оказалась документация
Оглавление

Как показывает практика, многие компании выкладывают немалые деньги за то, чтобы их сайты находились на топовых позициях в поисковых системах Интернета. Но эксперты информационных технологий обратили внимание на то, что сразу после попадания файлов Google Docs в выдачу Yandex, фирмы стараются сделать все возможное, чтобы страницы с личными данными не попали в поисковую выдачу. В чем причина таких действий? Сегодня расскажем все об утечках личной информации в Интернете, а также о том, как этого избежать.

Зона риска: какая персональная информация может оказаться в поисковых системах и причины этого явления

На самом деле утечки непубличной информации в поисковые системы происходят регулярно по всему миру. Грешат этим всевозможные онлайн-магазины, банковские организация, государственные структуры, различные сервисы и т.д.

  • Почему так происходит? Потому что «не дорабатывают», забывают вносить правки или даже не подозревают, что такая угроза существует. Многие компании попросту не имеют в своем штате СЕО-специалистов, которые обычно занимаются этими вопросами.
  • Что мы имеем в итоге? Такие ситуации чреваты тем, что поисковые системы в Интернете могут проиндексировать информацию, которую нельзя размещать в свободной доступе.
  • О какой информации идет речь? Существует много данных, о которых не принято рассказывать всем, кому не лень. К примеру: логины с паролями, скан-копии документов, подтверждающих личность, данные банковских карт, базы клиентов, отчеты и т.д.

Приведем конкретный пример: в 2017-м поисковик Гугл проиндексировал тексты, которые люди перевели при помощи облачного ресурса Translate.com. Это оказалась документация международной корпорации Statoil: отчеты, пароли, планы и т.д. Кто виноват в сложившейся ситуации? Работники ресурса, которые не закрыли данные от индексации.

Риск утечки информации в Интернете через облачные технологии, конечно, есть, но намного чаще непубличные данные оказываются в поисковых системах прямо с сайтов конкретных компаний. К примеру, фирма переехала на новый сайт, а работники забыли запретить индексировать страницы. Как говорится, сами «налажали».

-2

Как выявить утечку информации в Интернете и ликвидировать ее

  • Необходимо проверить все служебные домены и поддомены

Запомните, под раздачу может попасть не только сам сайт, но и ряд рабочих доменов и поддоменов. Так, например, Yandex.metrika индексирует все страницы Интернет-ресурсов, на которые заходили юзеры. При этом в разделе дополнительных настроек счетчика этого поисковика предусмотрен специальный чек-бокс, запрещающий отправлять страницы на индексацию. Для того, чтобы защитить непубличные данные, просто активируйте этот чек-бокс.

  • Надо изучить перечень страниц из индекса поисковых систем в Интернете

Следующий шаг – проверка проиндексированных страниц сайта, к примеру, в Yandex.

  • Для этого Вам понадобится специальный инструментарий – Yandex.Вебмастер. Как найти нужную информацию? Зайдите в категорию «Страницы, которые участвуют в поиске». Здесь представлен весь перечень страничек, которые ранее уже были проиндексированы.
  • Еще один вариант найти необходимые страницы – использовать парсеры: ComparseR, A-parser.
  • Также можно воспользоваться специальными программами-пауками: Screaming frog seo spider, Netpeak spider. Эти программулины занимаются анализом всех ссылок на Интернет-ресурсе без исключения, и позволяют получить всю необходимую информацию.
  • Удаляем страницы из поиска

Идем простым путем. Необходимо скрыть все страницы сайта от индексации. В этом помогут файлы robots.txt. Как это сделать читайте в подсказках Yandex или Google.

После того, как закроете странички, то можно проверить, все ли сделано правильно. Для этого зайдите в категорию «Анализ Robots.txt» в Yandex.Вебмастер.

-3

Какое время занимает ликвидация утечки непубличной информации в Интернете

Как показывает опыт, на решение проблемы уходит от 2 до 6 недель. Почему так много? Потому что поисковые системы должны переиндексировать правки, а на это необходимо определенные время. Есть возможность ускорить процедуру. Для этого можно воспользоваться следующими инструментами Яндекс и Гугл. Также Вы можете написать в службу техподдержки интересующей поисковой системы в Интернете с просьбой удалить проблемные страницы.

Послесловие

Чтобы не пропустить утечку личной информации в Интернете, систематически проводите аудит. Сделать это только один раз и навсегда не получится, потому что любые изменения на сайте могут стать причиной утечки.

Материал: https://smm-blog.com/secretnye-dannye-social-media/