Добавить в корзинуПозвонить
Найти в Дзене
Kangaroo

Продвинутый поиск в Гугл. Часть 2

С помощью оператора "site:" можно указывать определённые пути сайта. Помните, что это работает только для путей URL следующих непосредственно после доменного имени. Итак, как искать по тексту в других частях URL? Поиск по «папкам» сайта tesla announcements inurl:2018 К счастью, у Google есть оператор "inurl:", который позволяет искать по части адреса страницы. Помните, что текст, который вы указываете в "inurl:", может появиться где угодно в URL, а не только на уровне папки. Поиск по определённому диапазону дат tesla announcements daterange:2458272-2458302 Если вы хотите сузить поиск до конкретного диапазона дат, то для этого есть оператор "daterange:", который, в теории, позволяет указать даты публикации. К сожалению, в обычных органических результатах даты публикации не всегда точные, и на практике "daterange:" возвращает довольно странные результаты. Ещё вы могли обратить внимание, что используется довольно странный формат даты. Оператор "daterange:" используют Юлианский формат
Оглавление

С помощью оператора "site:" можно указывать определённые пути сайта.

Помните, что это работает только для путей URL следующих непосредственно после доменного имени. Итак, как искать по тексту в других частях URL?

Поиск по «папкам» сайта

tesla announcements inurl:2018

К счастью, у Google есть оператор "inurl:", который позволяет искать по части адреса страницы.

Помните, что текст, который вы указываете в "inurl:", может появиться где угодно в URL, а не только на уровне папки.

Поиск по определённому диапазону дат

tesla announcements daterange:2458272-2458302

Если вы хотите сузить поиск до конкретного диапазона дат, то для этого есть оператор "daterange:", который, в теории, позволяет указать даты публикации.

К сожалению, в обычных органических результатах даты публикации не всегда точные, и на практике "daterange:" возвращает довольно странные результаты. Ещё вы могли обратить внимание, что используется довольно странный формат даты. Оператор "daterange:" используют Юлианский формат даты.

Поиск по широкому диапазону дат

tesla announcement 2015..2017

Если вам не нужна особая точность в диапазоне дат, используйте оператор диапазона .. (двоеточие) с годами. Годы, как правило, достаточно уникальны, чтобы результаты были довольно релевантными.

Обратите внимание, что это не специальный поиск по дате, это что-то вроде хитрости. К сожалению, оператор диапазона не всегда правильно работает в паре с "inurl:" и другими продвинутыми операторами.

Поиск по файлам определённого типа

"информационная безопасность" filetype:pdf

Оператор "filetype:" позволяет указать расширение файла, например, PDF. В предыдущем примере нас интересуют поиск PDF файлов, содержащие точную фразу "информационная безопасность".

Оператор "filetype:" позволяет указывать различные типы файлов. Вы можете также попробовать "doc", "docx", "rtf" (Word), "xls", "xlsx" (Excel), "ppt", "pptx" (PowerPoint), и "txt" (текстовые файлы). Ещё можно использовать "filetype:" для указания определённых вариантов веб-страниц, включая "html", "htm", "php", "asp" и т.д. Имейте в виду, что расширение файла обычно должно указываться в URL-адресе, поэтому эти запросы не являются исчерпывающими.

С 2017 оператор "link:" является устаревшим. Теперь Google трактует "link" как слово для поиска и просто ищет совпадения.

Поиск внутри текста анкора

inanchor:"tesla announcements"

Вы можете использовать оператор "inanchor:" для поиска внутри текста ссылки. Например, приведённый выше поисковый запрос ищет сайты, на которые дана ссылка с сайтов с использованием фразы "tesla announcements" в тексте ссылки.

Помните, что оператор "inanchor:" представляет только небольшую выборку индекса и больше активно не поддерживается Google.

Поиск нескольких слов в тексте анкора

allinanchor: tesla announcements "model x"

Как и все другие вариации "allin…", "allinanchor:" применяется к каждому слову после него, выполняя поиск всех этих слов в тексте анкора, но не как точное соответствие.

Операторы для поиска по анкорам ("inanchor:", "allinanchor:") могут быть полезны для ваших начальных исследований, но не ждите от них полной, точной репрезентативности всех ссылок на ваш сайт или на сайты ваших конкурентов.

Фильтрация субдомена "www"

site:offensive-security.com -inurl:www

Для углубления в индекс сайта, комбинация "site:" с "inurl:" быстро станут вашими лучшими друзьями. Например, может быть вы ходите увидеть страницы, которые не входят в субдомен "www". Вы можете использовать "site:" вместе с негативным совпадением оператора "inurl:":

Если в качестве канонического имени (то, как адрес выглядит по умолчанию) выбрана версия с www, то вы быстро увидите новые субдомены (если они есть). Это может послужить хорошей отправной точкой для последующего углубления в изучение структуры сайта.

site:fsb.ru -inurl:www

Отфильтровка нескольких субдоменов

site:amazon.com -inurl:www -inurl:logistics -inurl:developer -inurl:kdp

Вы можете довольно сильно расширить эту концепцию, последовательно ограничивая поиска исключая всё новые домены.

Можно использовать десятки выражений с "inurl:" – неизвестно, есть ли какие-либо ограничение на их количество, но большинству сайтов в любом случае не потребуется так много. Просто помните об этом на тот случай, если вам это понадобится.

Поиск по одному субдомену

site:cooi.fsb.ru

Вы можете сфокусироваться на одном субдомене. Для поиска по одному поддомену предпочтительнее использовать оператор "site:". Посколкьу использование "site:" может найти текст в любом месте URL.

Вы можете расширить эту концепцию, ища одновременно и по субдоменам и по папкам.

site:en.kali.tools/all

Фильтр небезопасных страниц

site:amazon.com -inurl:https

Что интересно, вы можете использовать "inurl:" для включения или исключения из результатов безопасных (https:) страниц.

Если вы переводите сайт с "http:" на "https:" эта хитрость может вам помочь убедиться, что новые страницы проиндексированы должным образом и старые страницы постепенно исчезают из индекса.

Поиск по URL параметру

site:amazon.com inurl:field-keywords

Вы можете использовать "inurl:" чтобы нацелиться на URL параметр динамической страницы.

Помните, что нет способа указать именно URL параметр – Google может найти текст в любой части URL. Но хорошая новость в том, что параметрам свойственно иметь уникальные имена.

Поиск по нескольким URL атрибутам

allinurl: amazon field-keywords nikon

Так же как "allintitle:" и "allintext:" имеется оператор "allinurl:". В этом примере вы ищите внутренние страницы поиска на Amazon, которые имеют слово "Nikon" в URL:

К сожалению "allinurl:" страдает от двух проблем. Одна в том, что вы не можете надёжно совместить его с "site:", что ограничивает ваши опции. Вторая – он склонен возвращать странные результаты. В большинстве случаев рекомендуется вместо него использовать несколько "inurl:".

Поиск заблудившихся текстовых файлов

site:yandex.ru filetype:txt -inurl:robots.txt

Вас может посетить мысль, а не забыли ли вы где-нибудь на сайте файлы документов, которые могла подобрать Google. Вы можете проверить это используя комбинацию "site:" и "filetype:".

В примере исключён из результатов выдачи файл "robots.txt" (используя "-inurl:").

Это комбо хороший способ зачистить файлы, которые случайно были оставлены на сайте.

Поиск страниц-дублей на сайте

site:amazon.com "hot wheels 20 car gift pack"

Используя оператор "site:" с точно совпадающей фразой вы можете найти дублирующие или очень похожие страницы.

Ищем дублирующие заголовки

site:amazon.com intitle:"hot wheels 20 car gift pack"

Используя "site:" плюс "intitle:" вы можете найти страницы на сайте, которые могут быть полными дубликатами.

Поиск дубликатов с исключением

site:amazon.com intitle:"hot wheels 20 car gift pack" -inurl:review -inurl:reviews

При поиске вы можете группировать разные операторы – достигая нужного уровня точности.

Поиск домена в других доменных зонах

site:hackware.* -site:hackware.ru

Это простой и быстрый способ найти зарегистрированные доменные имена в других доменных зонах (доменах верхнего уровня).

Информация о странице

info:yandex.ru

С помощью info: вы можете получить краткую информацию о странице. Для большинства сайтов просто показывается случайная цитата с интересующей страницы и её заголовок.

Поиск кешированной версии сайта

cache:hackware.ru/?p=21

Это не совсем поиск, команда cache: - это возможность посмотреть кэшированную версию сайта. Т.е. если сайт изменился за последнее время, в кэше могла сохраниться его предыдущая версия.

А у меня пока что все, подписывайтесь, ставьте лайки и ждите новый контент.