Добавить в корзинуПозвонить
Найти в Дзене
Mycroft Intelligence

Инструментарий | PDF Crawler

Чем отличается условный «технический» OSINT от «корпоративного» OSINT? Пентестеры используют OSINT для сбора установочной информации о цели для последующей эксплуатации. Корпоративные разведчики ищут информацию, которая даст клиенту конкурентное преимущество. Таким образом, если для пентестера главный улов – это различного рода эксплойты, то для специалиста по разведке – это документы. Да-да, именно в pdf-документах, excel-таблицах и вордовых доках спрятано то, за что нам много платят. Встает вопрос: как искать документы? Первоклашка ответит – filetype:pdf. А что, если документы неиндексированы, или же поисковая система не выдает нужные нам ссылки? Как говорится, хочешь сделать что-то качественно – сделай это сам. Поэтому нам на помощь приходят инструменты индексации и различные краулеры. Я вам рекомендую инструмент SimFin's PDF Crawler [1]. Что он делает? Вводите урл, устанавливаете глубину и метод сканирования и вуаля – краулер сам обходит сайт и ищет все что не прибито к полу pdf-фа

Чем отличается условный «технический» OSINT от «корпоративного» OSINT? Пентестеры используют OSINT для сбора установочной информации о цели для последующей эксплуатации. Корпоративные разведчики ищут информацию, которая даст клиенту конкурентное преимущество.

Таким образом, если для пентестера главный улов – это различного рода эксплойты, то для специалиста по разведке – это документы. Да-да, именно в pdf-документах, excel-таблицах и вордовых доках спрятано то, за что нам много платят.

Встает вопрос: как искать документы? Первоклашка ответит – filetype:pdf. А что, если документы неиндексированы, или же поисковая система не выдает нужные нам ссылки?

Как говорится, хочешь сделать что-то качественно – сделай это сам. Поэтому нам на помощь приходят инструменты индексации и различные краулеры. Я вам рекомендую инструмент SimFin's PDF Crawler [1].

Что он делает? Вводите урл, устанавливаете глубину и метод сканирования и вуаля – краулер сам обходит сайт и ищет все что не прибито к полу pdf-файлы. И на выходе вы получаете все документы с конкретного сайта или страницы. Как показывает практика, этот инструмент часто сканирует лучше, чем великий и могучий Google.

#библиотека #it #osint #технологии #разведка #кибердед