С помощью оператора "site:" можно указывать определённые пути сайта.
Помните, что это работает только для путей URL следующих непосредственно после доменного имени. Итак, как искать по тексту в других частях URL?
Поиск по «папкам» сайта
tesla announcements inurl:2018
К счастью, у Google есть оператор "inurl:", который позволяет искать по части адреса страницы.
Помните, что текст, который вы указываете в "inurl:", может появиться где угодно в URL, а не только на уровне папки.
Поиск по определённому диапазону дат
tesla announcements daterange:2458272-2458302
Если вы хотите сузить поиск до конкретного диапазона дат, то для этого есть оператор "daterange:", который, в теории, позволяет указать даты публикации.
К сожалению, в обычных органических результатах даты публикации не всегда точные, и на практике "daterange:" возвращает довольно странные результаты. Ещё вы могли обратить внимание, что используется довольно странный формат даты. Оператор "daterange:" используют Юлианский формат даты.
Поиск по широкому диапазону дат
tesla announcement 2015..2017
Если вам не нужна особая точность в диапазоне дат, используйте оператор диапазона .. (двоеточие) с годами. Годы, как правило, достаточно уникальны, чтобы результаты были довольно релевантными.
Обратите внимание, что это не специальный поиск по дате, это что-то вроде хитрости. К сожалению, оператор диапазона не всегда правильно работает в паре с "inurl:" и другими продвинутыми операторами.
Поиск по файлам определённого типа
"информационная безопасность" filetype:pdf
Оператор "filetype:" позволяет указать расширение файла, например, PDF. В предыдущем примере нас интересуют поиск PDF файлов, содержащие точную фразу "информационная безопасность".
Оператор "filetype:" позволяет указывать различные типы файлов. Вы можете также попробовать "doc", "docx", "rtf" (Word), "xls", "xlsx" (Excel), "ppt", "pptx" (PowerPoint), и "txt" (текстовые файлы). Ещё можно использовать "filetype:" для указания определённых вариантов веб-страниц, включая "html", "htm", "php", "asp" и т.д. Имейте в виду, что расширение файла обычно должно указываться в URL-адресе, поэтому эти запросы не являются исчерпывающими.
Поиск ссылок – оператор "link:"
С 2017 оператор "link:" является устаревшим. Теперь Google трактует "link" как слово для поиска и просто ищет совпадения.
Поиск внутри текста анкора
inanchor:"tesla announcements"
Вы можете использовать оператор "inanchor:" для поиска внутри текста ссылки. Например, приведённый выше поисковый запрос ищет сайты, на которые дана ссылка с сайтов с использованием фразы "tesla announcements" в тексте ссылки.
Помните, что оператор "inanchor:" представляет только небольшую выборку индекса и больше активно не поддерживается Google.
Поиск нескольких слов в тексте анкора
allinanchor: tesla announcements "model x"
Как и все другие вариации "allin…", "allinanchor:" применяется к каждому слову после него, выполняя поиск всех этих слов в тексте анкора, но не как точное соответствие.
Операторы для поиска по анкорам ("inanchor:", "allinanchor:") могут быть полезны для ваших начальных исследований, но не ждите от них полной, точной репрезентативности всех ссылок на ваш сайт или на сайты ваших конкурентов.
Фильтрация субдомена "www"
site:offensive-security.com -inurl:www
Для углубления в индекс сайта, комбинация "site:" с "inurl:" быстро станут вашими лучшими друзьями. Например, может быть вы ходите увидеть страницы, которые не входят в субдомен "www". Вы можете использовать "site:" вместе с негативным совпадением оператора "inurl:":
Если в качестве канонического имени (то, как адрес выглядит по умолчанию) выбрана версия с www, то вы быстро увидите новые субдомены (если они есть). Это может послужить хорошей отправной точкой для последующего углубления в изучение структуры сайта.
site:fsb.ru -inurl:www
Отфильтровка нескольких субдоменов
site:amazon.com -inurl:www -inurl:logistics -inurl:developer -inurl:kdp
Вы можете довольно сильно расширить эту концепцию, последовательно ограничивая поиска исключая всё новые домены.
Можно использовать десятки выражений с "inurl:" – неизвестно, есть ли какие-либо ограничение на их количество, но большинству сайтов в любом случае не потребуется так много. Просто помните об этом на тот случай, если вам это понадобится.
Поиск по одному субдомену
site:cooi.fsb.ru
Вы можете сфокусироваться на одном субдомене. Для поиска по одному поддомену предпочтительнее использовать оператор "site:". Посколкьу использование "site:" может найти текст в любом месте URL.
Вы можете расширить эту концепцию, ища одновременно и по субдоменам и по папкам.
site:en.kali.tools/all
Фильтр небезопасных страниц
site:amazon.com -inurl:https
Что интересно, вы можете использовать "inurl:" для включения или исключения из результатов безопасных (https:) страниц.
Если вы переводите сайт с "http:" на "https:" эта хитрость может вам помочь убедиться, что новые страницы проиндексированы должным образом и старые страницы постепенно исчезают из индекса.
Поиск по URL параметру
site:amazon.com inurl:field-keywords
Вы можете использовать "inurl:" чтобы нацелиться на URL параметр динамической страницы.
Помните, что нет способа указать именно URL параметр – Google может найти текст в любой части URL. Но хорошая новость в том, что параметрам свойственно иметь уникальные имена.
Поиск по нескольким URL атрибутам
allinurl: amazon field-keywords nikon
Так же как "allintitle:" и "allintext:" имеется оператор "allinurl:". В этом примере вы ищите внутренние страницы поиска на Amazon, которые имеют слово "Nikon" в URL:
К сожалению "allinurl:" страдает от двух проблем. Одна в том, что вы не можете надёжно совместить его с "site:", что ограничивает ваши опции. Вторая – он склонен возвращать странные результаты. В большинстве случаев рекомендуется вместо него использовать несколько "inurl:".
Поиск заблудившихся текстовых файлов
site:yandex.ru filetype:txt -inurl:robots.txt
Вас может посетить мысль, а не забыли ли вы где-нибудь на сайте файлы документов, которые могла подобрать Google. Вы можете проверить это используя комбинацию "site:" и "filetype:".
В примере исключён из результатов выдачи файл "robots.txt" (используя "-inurl:").
Это комбо хороший способ зачистить файлы, которые случайно были оставлены на сайте.
Поиск страниц-дублей на сайте
site:amazon.com "hot wheels 20 car gift pack"
Используя оператор "site:" с точно совпадающей фразой вы можете найти дублирующие или очень похожие страницы.
Ищем дублирующие заголовки
site:amazon.com intitle:"hot wheels 20 car gift pack"
Используя "site:" плюс "intitle:" вы можете найти страницы на сайте, которые могут быть полными дубликатами.
Поиск дубликатов с исключением
site:amazon.com intitle:"hot wheels 20 car gift pack" -inurl:review -inurl:reviews
При поиске вы можете группировать разные операторы – достигая нужного уровня точности.
Поиск домена в других доменных зонах
site:hackware.* -site:hackware.ru
Это простой и быстрый способ найти зарегистрированные доменные имена в других доменных зонах (доменах верхнего уровня).
Информация о странице
info:yandex.ru
С помощью info: вы можете получить краткую информацию о странице. Для большинства сайтов просто показывается случайная цитата с интересующей страницы и её заголовок.
Поиск кешированной версии сайта
cache:hackware.ru/?p=21
Это не совсем поиск, команда cache: - это возможность посмотреть кэшированную версию сайта. Т.е. если сайт изменился за последнее время, в кэше могла сохраниться его предыдущая версия.
А у меня пока что все, подписывайтесь, ставьте лайки и ждите новый контент.