Попасть в заветные верхние строчки на страницах поисковых систем – мечта многих бизнесменов. Но порой излишняя популярность бывает источником проблем. Это знают многие бренды и фильтруют информацию, чтобы конфиденциальное не оказались во всеобщем доступе. Мы расскажем вам почему случаются утечки, как их обнаружить и предотвратить.
Какие данные могут попасть поиск и почему
Проблемы с информационными утечками бывают у многих. Банки, сервисы, мелкий и большой бизнес порой не держат своих работников по SEO и не знают о возникшей проблеме. Другим мешает бюрократия и необходимость согласовывать изменения с большим количеством отделов и лиц компании.
Всегда есть риск, что поисковики проиндексируют какие-то конфиденциальные данные. Логины, пароли, отчёты, базы клиентов, скриншоты документов и номера платёжных карт.
Сравнительно недавно подобная ситуация произошла с компанией Translate.com. в свободном доступе попали внутренние документы большой международной компании: контракты, кадровые бумаги, пароли. В сервисе сохранялись тексты пользователей для асессоров, которые занимались обучением алгоритма переводчика. Гораздо чаще утечка данных происходит с сайтов компаний. Работники оставляют страницы для внутреннего использования в свободном доступе, а поисковые системы их находят и индексируют.
Как найти утечку данных
1. Проверьте служебные домены и поддомены сайта
Помимо сайта и его главных разделов есть служебные домены и поддомены. Например, они были созданы для проведения тестирования или размещения 1 C.
Какие с этим могут быть сложности:
• поддомены не были закрыты от индексации;
• на поддоменах использовался http-протокол;
• авторизация не была защищена паролем.
Любой пользователь мог воспользоваться этой важной информацией. Проверить количество подконтрольных доменов и поддоменов можно в «Яндекс.Метрике» или Google Analytics в отчёте «Страницы входа».
В «Яндекс.Метрике» есть «Запрет отправки на индексацию страниц сайта». Он находится в дополнительных настройках. активируйте его и ваши данные не будут проиндексированы.
2. Проанализируйте список проиндексированных страниц
Проверить все проиндексированные страницы можно в «Яндекс.Вебмастере», различных парсерах или при выкачивании сайта.
Таким образом можно проверить ссылки на сайте и узнать какие страницы могут быть доступны поисковому роботу.
Как убрать страницы из поиска
Проще всего элементарно закрыть страницы от индексации в файле robots.txt. После чего проверить в Яндекс.Вебмастере и Google.
Поэтому лучше подстраховаться и сделать секретные разделы доступными только при авторизации.
Сколько времени потребуется, чтобы исправить ситуацию
На устранение проблемы утечки конфиденциальной информации понадобится от 2 до 6 недель, потому что поисковикам надо будет время на проведение переиндексации.
Чтобы ускорить процесс, можно будет обратиться в службу технической поддержки конкретной поисковой системы.
Как жить дальше
Не стоит особенно переживать, если утечка данных произошла. Лучше задумайтесь о том, чтобы этого не происходило впредь. Заключите договор с профессиональным SEO-агентством или специалистом и задумайтесь о дальнейшем сотрудничестве с ним.
Понравился материал? Подписывайтесь на наш канал, ставьте лайки и оставляйте комментарии! Есть вопросы? Свяжитесь с нами: https://www.whynot-studio.ru