Найти в Дзене
Хроники диванной разведки

4 полезных функции Всемирного архива интернета

Оглавление
newscientist.com
newscientist.com

Многие люди недооценивают сайт web.archive.org. Его часто помещают в подборки развлекательных ресурсов и описывают его функциональность очень поверхностно.

https://web.archive.org/web/*/https://www.securitylab.ru/ Некоторые популярные и постоянно обновляемые сайты web.archive.org  сохраняет несколько раз в день
https://web.archive.org/web/*/https://www.securitylab.ru/ Некоторые популярные и постоянно обновляемые сайты web.archive.org сохраняет несколько раз в день

"Скопируйте ссылку на сайт в форму на главной странице и получите возможность смотреть его сохраненные версии за разные даты".

И всё.

А ведь Всемирный архив интернета имеет множество возможностей для поиска и анализа информации в архиве из более чем полумиллиарда веб-страниц (сохранялись с мая 1996 года) и десятков миллионов файлов самых разных типов (изображения, аудио, видео, тексты).

И этот сервис — незаменимый инструмент для поиска информации о человеке или компании, которым стоит уметь полноценно пользоваться.

Вот 4 интересные фишки сайта web.archive.org.

1. Просмотр списка всех сохранённых страниц сайта

https://web.archive.org/web/*/https://www.ptsecurity.com/ru-ru/*
https://web.archive.org/web/*/https://www.ptsecurity.com/ru-ru/*

Если в форму на главной странице после слеша в конце URL-адреса набрать звёздочку. Например:

https://www.ptsecurity.com/ru-ru/*

То вместо календаря с разными версиями главной страницы отобразится список всех страниц и файлов сайтов, которые были сохранены во Всемирном архиве интернета хотя бы один раз.

Таблицу можно отсортировать по типу, дате первого сохранения, дате последнего сохранения и числу дубликатов (сохранений). Также есть поле для фильтрации файлов по расширению. Например, если ввести в нём ".jpg", то в списке останутся только картинки.

https://web.archive.org/web/sitemap/https://www.securitylab.ru
https://web.archive.org/web/sitemap/https://www.securitylab.ru

Если ввести адрес сайта без звёздочки, то появится стандартная панель со вкладками "Календарь", "Коллекции", "Изменения", "Резюме" и "Карта сайта".

https://web.archive.org/web/sitemap/https://www.securitylab.ru/
https://web.archive.org/web/sitemap/https://www.securitylab.ru/

Если нажать на вкладку "Карта сайта", то появится кольцевая диаграмма файловой структуры сайта с возможностью переключения между её версиями разных лет.

2. Возможность посмотреть email-адрес отправителя файла

https://archive.org/details/2019.10.14atasovaeminebursaliimamhatiportaokulu
https://archive.org/details/2019.10.14atasovaeminebursaliimamhatiportaokulu

Помимо веб-страниц, во Всемирном архиве интернета хранятся десятки миллионов файлов, загруженных пользователями. Например, фотографии различных достопримечательностей или сканы газет и журналов.

Иногда бывает, что какой-то файл вызывает вопросы и возникает необходимость связаться его с владельцем. Например, чтобы спросить, нет ли у него другой прессы, издаваемой в том же городе или других снимков того же места/человека.

https://archive.org/details/2019.10.14atasovaeminebursaliimamhatiportaokulu
https://archive.org/details/2019.10.14atasovaeminebursaliimamhatiportaokulu

Email-адрес отправителя можно найти в метаданных файла. Вот как это сделать:

Заходим на страницу с файлом и в правой панели нажимаем на кнопку Show All (под словами Download Options).

https://archive.org/download/2019.10.14atasovaeminebursaliimamhatiportaokulu
https://archive.org/download/2019.10.14atasovaeminebursaliimamhatiportaokulu

Выбираем файл, название которого заканчивается на meta.xml и открываем его.

https://ia802903.us.archive.org/9/items/2019.10.14atasovaeminebursaliimamhatiportaokulu/2019.10.14atasovaeminebursaliimamhatiportaokulu_meta.xml
https://ia802903.us.archive.org/9/items/2019.10.14atasovaeminebursaliimamhatiportaokulu/2019.10.14atasovaeminebursaliimamhatiportaokulu_meta.xml

Между тегами <uploader></uploader> написан email-адрес, который использовался пользователем при регистрации на web.archive.org.

3. Сохранение страниц

https://archive.org/
https://archive.org/

Если зайти на главную страницу и в верхней панели щелкнуть мышкой по вкладке Web, то отобразится панель с формой для сохранения сайта во Всемирном архиве интернета (крайний правый блок — Save Page Now).

Эту функцию можно использовать, чтобы не терять интересные вам страницы в случае, если их владельцы когда-нибудь решат их удалить.

Для сохранения страниц и файлов нужно сначала зарегистрироваться на web.archive.org.

4. Расширенный поиск

https://archive.org/advancedsearch.php
https://archive.org/advancedsearch.php

Для навигации по файлам во Всемирном архиве интернета предусмотрен расширенный поиск. Он доступен по адресу archive.org/advancedsearch.php.

Искать файлы можно по ключевым словам, названию, описанию, имени создателя, принадлежности к коллекции, типу и дате сохранения (можно выбрать конкретный день или временной промежуток между двумя датами).

https://archive.org/search.php?query=mediatype%3A%28image%29%20AND%20date%3A%5B1995-03-02%20TO%201996-01-01%5D
https://archive.org/search.php?query=mediatype%3A%28image%29%20AND%20date%3A%5B1995-03-02%20TO%201996-01-01%5D

Можно пользоваться как формами для ввода параметров поиска, так и операторами поиска. Например:

mediatype: [text] — (тип файла текст)

date:[1995-03-02 TO 1996-01-01] — (дата сохранения от 2 марта 1995 года до 1 января 1996 года).

title:(ivanov) — в заголовке присутствует слово ivanov.

Эти 4 фишки — просто примеры того, на что способен web.archive.org, приведенные для того, чтобы показать на что способен сайт и подогреть интерес читателя к его расширенной функциональности. Узнать же о всех нюансах и тонкостях использования сервиса можно в англоязычном блоге его создателей (blog.archive.org).

Другие статьи на тему OSINT:

4 способа применить с пользой поисковики по публичным FTP-серверам

Как найти человека в соцсетях по его фотороботу

Как посмотреть на карте где автобус дальнего следования находится в данный момент