Найти в Дзене

Яндекс ищет лучше, чем вы думаете: операторы поиска

Вы вводите запрос - Яндекс возвращает 4 миллиона страниц. Нужная - где-то там.
Большинство людей в этот момент листают выдачу, уточняют слова, добавляют кавычки наугад и в итоге либо находят что-то похожее, либо сдаются. Это не проблема Яндекса - это проблема языка запроса. Поисковик понимает специальный синтаксис, который позволяет сузить поиск до конкретного сайта, типа файла, временного
Оглавление

Глубокий поиск в Яндексе
Глубокий поиск в Яндексе

Вы вводите запрос - Яндекс возвращает 4 миллиона страниц. Нужная - где-то там.

Большинство людей в этот момент листают выдачу, уточняют слова, добавляют кавычки наугад и в итоге либо находят что-то похожее, либо сдаются. Это не проблема Яндекса - это проблема языка запроса. Поисковик понимает специальный синтаксис, который позволяет сузить поиск до конкретного сайта, типа файла, временного периода или точного расположения слов на странице. Такой синтаксис называют операторами поиска - или, по аналогии с Google, «дорками». О них также есть статья на моем канале.

Слово «дорк» (от английского dork - «чудак») прижилось в среде тех, кто умеет искать нестандартно. Никакой магии: просто набор команд, которые поисковик понимает буквально. Если знаешь команды - находишь то, что другие не могут найти вообще.

Почему обычный поиск не справляется

Представьте: вам нужен PDF-отчёт о состоянии российского рынка телекоммуникаций за 2006 год. Вы вводите «рынок телекоммуникаций Россия 2006 отчёт» - и получаете новостные статьи 2023 года, форумы, рекламу консалтинговых агентств и пару ссылок на платные базы данных. Нужного документа нет на первых трёх страницах. Возможно, он существует - просто Яндекс не знает, что вы ищете именно PDF именно того периода именно с конкретными словами в названии.

Это классическая ситуация, где операторы решают задачу за 15 секунд.

Яндекс обрабатывает запрос как набор слов и пытается угадать намерение. Операторы убирают угадывание - вы говорите поисковику точно, что искать и где. Разница между «найди что-нибудь похожее» и «найди вот это».

Базовый словарь: операторы, которые работают прямо сейчас

Начнём с простого. Каждый оператор - это слово или символ, который меняет логику поиска. Их можно комбинировать в одном запросе.

Кавычки " " - точная фраза

Самый недооценённый инструмент. Запрос "технологии сегодня" найдёт страницы, где эти два слова стоят рядом именно в таком порядке. Без кавычек Яндекс ищет страницы, где встречается хотя бы одно из слов - и выдаёт миллион результатов вместо тысячи нужных.

site: - поиск внутри конкретного сайта

site:rbc.ru инфляция - найдёт все материалы РБК про инфляцию. Работает лучше, чем встроенный поиск на большинстве сайтов. Особенно полезно на государственных порталах, где собственный поиск сломан или отсутствует.

filetype: - поиск по типу файла

filetype:pdf ограничивает выдачу только PDF-документами. Работает и с другими форматами: filetype:doc, filetype:xls, filetype:ppt. Яндекс индексирует содержимое документов - значит, можно искать по тексту внутри файла, а не только по названию страницы.

url: - слово в адресе страницы

url:doklad найдёт страницы, в адресе которых есть слово «doklad». Полезно, когда ищете разделы сайтов с отчётами, докладами, архивами - их часто называют именно так в URL.

title: - слово в заголовке страницы

title:"технологии сегодня" ищет страницы, где эта фраза стоит в теге заголовка. Это сильнее, чем просто поиск по тексту: если слова в заголовке - скорее всего, страница именно об этом, а не просто упоминает тему вскользь.

date: - ограничение по дате

Синтаксис: date:20050101..20071231 - найдёт документы, проиндексированные с 1 января 2005 по 31 декабря 2007. Формат: ГГГГММДД..ГГГГММДД. Можно указать одну дату - тогда ищет с этого момента до сегодня.

- (минус) - исключение слова

технологии -маркетинг уберёт из выдачи всё, что связано с маркетингом. Незаменимо, когда слово многозначное: ищете «Ягуар» как автомобиль - добавляете -животное -кошка.

| (вертикальная черта) - логическое «ИЛИ»

смартфон | телефон найдёт страницы, где встречается хотя бы одно из слов. Полезно, когда тема может называться по-разному.

~ (тильда) - синонимы

~дешёвый ноутбук расширит поиск на синонимы: «бюджетный», «недорогой», «экономичный». Яндекс сам подберёт близкие по смыслу слова.

От теории к практике: разбираем реальные запросы

Теперь собираем операторы в рабочие конструкции. Каждый пример - это задача, которую обычный поиск решает плохо или не решает вообще.

Задача 1: найти PDF с конкретными словами в названии за определённые годы

Запрос: title:"технологии сегодня" filetype:pdf date:20050101..20071231

Что происходит: Яндекс ищет только PDF-документы, у которых в заголовке стоит точная фраза «технологии сегодня», и отбирает только те, что были проиндексированы в период с 2005 по 2007 год. Вместо миллиона результатов - десятки, и все по делу.

Задача 2: найти открытые Excel-таблицы с данными по зарплатам

Запрос: filetype:xls "зарплата" "2023" site:gov.ru

Государственные сайты часто публикуют статистику в табличном формате, но не делают её очевидной. Этот запрос найдёт XLS-файлы на официальных порталах с нужными словами внутри. Аналогично работает для site:edu.ru - университетские данные, учебные планы, расписания.

Задача 3: найти страницы с конкретной фразой, исключив коммерческий мусор

Запрос: "открытый исходный код" title:руководство -купить -цена -скачать

Ищете техническую документацию, а Яндекс подсовывает магазины и лендинги? Минус-слова чистят выдачу радикально. Можно добавить несколько через пробел: -купить -цена -заказать -стоимость.

Задача 4: найти забытый материал на конкретном сайте

Запрос: site:habr.com title:"docker" date:20180101..20190101

Вы помните, что читали статью про Docker на Хабре примерно в 2018-2019 году, но не помните название. Этот запрос выдаст все материалы Хабра с «docker» в заголовке за тот период. Работает как личная машина времени по архивам сайта.

Задача 5: найти презентации по теме для подготовки к докладу

Запрос: filetype:ppt "цифровая трансформация" "промышленность" date:20210101..20231231

PowerPoint-файлы часто содержат структурированную информацию, которую не найдёшь в статьях: схемы, цифры, сравнения. Их публикуют на конференциях, в университетах, на корпоративных порталах - и Яндекс их индексирует.

Сложные комбинации: когда операторов несколько

Операторы работают вместе - и здесь начинается настоящий поиск.

Пример из практики: нужно найти открытые данные по экологической обстановке в конкретном регионе, опубликованные государственными структурами в виде документов.

Запрос: site:gov.ru | site:mnr.gov.ru "экологический мониторинг" "Краснодарский край" filetype:pdf date:20200101..20231231

Разбираем по частям:

  • site:gov.ru | site:mnr.gov.ru - ищем на государственных сайтах или конкретно на сайте Министерства природных ресурсов
  • "экологический мониторинг" - точная фраза, не просто похожие слова
  • "Краснодарский край" - ещё одна точная фраза, фильтрует по региону
  • filetype:pdf - только документы PDF
  • date:20240101..20251231 - только свежие данные

Такой запрос в обычном режиме поиска не собрать никакими словами. Яндекс просто не поймёт, что вам нужно именно это пересечение условий.

Ещё один пример - поиск учебных материалов:

site:edu.ru | site:msu.ru filetype:pdf title:"лекция" "машинное обучение" -платно -курс

Университетские лекции в PDF, опубликованные на образовательных порталах, по теме машинного обучения - без коммерческих курсов в выдаче.

Где это реально полезно: сценарии из жизни

Операторы поиска - не игрушка для технарей. Вот ситуации, где они экономят час работы:

Журналисты и исследователи используют site: и filetype: для поиска первоисточников: официальных отчётов, статистики, протоколов. То, что пресс-служба не выложила на главную - часто лежит в глубине сайта и индексируется Яндексом.

Студенты и преподаватели находят через filetype:pdf site:edu.ru учебники, методички и лекции, которые официально доступны, но не рекламируются.

HR и рекрутеры применяют site: для поиска резюме на конкретных платформах или title: для поиска профилей с нужными словами в заголовке страницы.

Разработчики ищут через site:github.com или site:stackoverflow.com конкретные решения с нужными словами в заголовке обсуждения - быстрее, чем встроенный поиск этих платформ.

Все остальные - когда нужно найти старую статью, документ, инструкцию или прайс, которые точно существуют, но обычный поиск их не показывает.

Честно о ограничениях

Операторы - не волшебная палочка. Несколько вещей, которые стоит знать сразу.

date: в Яндексе работает по дате индексации, а не по дате публикации. Документ 2005 года, переиндексированный в 2020-м, может не попасть в выборку за 2005-2007. Это раздражает, но обойти сложно - просто учитывайте при интерпретации результатов.

filetype: иногда пропускает документы, если сайт закрыл прямой доступ к файлам. Яндекс индексирует то, что может прочитать - если файл за авторизацией, оператор его не найдёт.

Комбинация слишком многих операторов сужает выдачу до нуля. Если результатов нет - уберите один оператор и попробуйте снова. Поиск с операторами - это итеративный процесс, а не одна попытка.

И последнее: Яндекс периодически меняет поддержку операторов без объявлений. Большинство из перечисленных работают стабильно годами, но если что-то перестало работать - проверьте актуальную справку Яндекса.

Попробуйте прямо сейчас

Лучший способ убедиться - один рабочий запрос. Возьмите любую тему, которую вы искали последние недели и не нашли нормального первоисточника. Добавьте filetype:pdf и title: с ключевой фразой. Сравните с тем, что выдаёт обычный поиск.

Операторы поиска - это навык, который большинство людей никогда не осваивают, хотя он доступен всем и бесплатен. Разрыв между тем, кто умеет ими пользоваться, и тем, кто не умеет, - это разрыв в качестве найденной информации. Не в скорости печати, не в умении формулировать - именно в качестве.

Какой запрос вы бы хотели научиться составлять - поделитесь в комментариях, разберём конкретный случай.

Источник: Справка Яндекса - язык запросов

🔔 Подпишитесь на КликХак - здесь про инструменты, которые работают, а не про хайп вокруг новых гаджетов.