Многие люди недооценивают сайт web.archive.org. Его часто помещают в подборки развлекательных ресурсов и описывают его функциональность очень поверхностно.
"Скопируйте ссылку на сайт в форму на главной странице и получите возможность смотреть его сохраненные версии за разные даты".
И всё.
А ведь Всемирный архив интернета имеет множество возможностей для поиска и анализа информации в архиве из более чем полумиллиарда веб-страниц (сохранялись с мая 1996 года) и десятков миллионов файлов самых разных типов (изображения, аудио, видео, тексты).
И этот сервис — незаменимый инструмент для поиска информации о человеке или компании, которым стоит уметь полноценно пользоваться.
Вот 4 интересные фишки сайта web.archive.org.
1. Просмотр списка всех сохранённых страниц сайта
Если в форму на главной странице после слеша в конце URL-адреса набрать звёздочку. Например:
https://www.ptsecurity.com/ru-ru/*
То вместо календаря с разными версиями главной страницы отобразится список всех страниц и файлов сайтов, которые были сохранены во Всемирном архиве интернета хотя бы один раз.
Таблицу можно отсортировать по типу, дате первого сохранения, дате последнего сохранения и числу дубликатов (сохранений). Также есть поле для фильтрации файлов по расширению. Например, если ввести в нём ".jpg", то в списке останутся только картинки.
Если ввести адрес сайта без звёздочки, то появится стандартная панель со вкладками "Календарь", "Коллекции", "Изменения", "Резюме" и "Карта сайта".
Если нажать на вкладку "Карта сайта", то появится кольцевая диаграмма файловой структуры сайта с возможностью переключения между её версиями разных лет.
2. Возможность посмотреть email-адрес отправителя файла
Помимо веб-страниц, во Всемирном архиве интернета хранятся десятки миллионов файлов, загруженных пользователями. Например, фотографии различных достопримечательностей или сканы газет и журналов.
Иногда бывает, что какой-то файл вызывает вопросы и возникает необходимость связаться его с владельцем. Например, чтобы спросить, нет ли у него другой прессы, издаваемой в том же городе или других снимков того же места/человека.
Email-адрес отправителя можно найти в метаданных файла. Вот как это сделать:
Заходим на страницу с файлом и в правой панели нажимаем на кнопку Show All (под словами Download Options).
Выбираем файл, название которого заканчивается на meta.xml и открываем его.
Между тегами <uploader></uploader> написан email-адрес, который использовался пользователем при регистрации на web.archive.org.
3. Сохранение страниц
Если зайти на главную страницу и в верхней панели щелкнуть мышкой по вкладке Web, то отобразится панель с формой для сохранения сайта во Всемирном архиве интернета (крайний правый блок — Save Page Now).
Эту функцию можно использовать, чтобы не терять интересные вам страницы в случае, если их владельцы когда-нибудь решат их удалить.
Для сохранения страниц и файлов нужно сначала зарегистрироваться на web.archive.org.
4. Расширенный поиск
Для навигации по файлам во Всемирном архиве интернета предусмотрен расширенный поиск. Он доступен по адресу archive.org/advancedsearch.php.
Искать файлы можно по ключевым словам, названию, описанию, имени создателя, принадлежности к коллекции, типу и дате сохранения (можно выбрать конкретный день или временной промежуток между двумя датами).
Можно пользоваться как формами для ввода параметров поиска, так и операторами поиска. Например:
mediatype: [text] — (тип файла текст)
date:[1995-03-02 TO 1996-01-01] — (дата сохранения от 2 марта 1995 года до 1 января 1996 года).
title:(ivanov) — в заголовке присутствует слово ivanov.
Эти 4 фишки — просто примеры того, на что способен web.archive.org, приведенные для того, чтобы показать на что способен сайт и подогреть интерес читателя к его расширенной функциональности. Узнать же о всех нюансах и тонкостях использования сервиса можно в англоязычном блоге его создателей (blog.archive.org).
Другие статьи на тему OSINT:
4 способа применить с пользой поисковики по публичным FTP-серверам
Как найти человека в соцсетях по его фотороботу
Как посмотреть на карте где автобус дальнего следования находится в данный момент