Вы вводите запрос - Яндекс возвращает 4 миллиона страниц. Нужная - где-то там.
Большинство людей в этот момент листают выдачу, уточняют слова, добавляют кавычки наугад и в итоге либо находят что-то похожее, либо сдаются. Это не проблема Яндекса - это проблема языка запроса. Поисковик понимает специальный синтаксис, который позволяет сузить поиск до конкретного сайта, типа файла, временного периода или точного расположения слов на странице. Такой синтаксис называют операторами поиска - или, по аналогии с Google, «дорками». О них также есть статья на моем канале.
Слово «дорк» (от английского dork - «чудак») прижилось в среде тех, кто умеет искать нестандартно. Никакой магии: просто набор команд, которые поисковик понимает буквально. Если знаешь команды - находишь то, что другие не могут найти вообще.
Почему обычный поиск не справляется
Представьте: вам нужен PDF-отчёт о состоянии российского рынка телекоммуникаций за 2006 год. Вы вводите «рынок телекоммуникаций Россия 2006 отчёт» - и получаете новостные статьи 2023 года, форумы, рекламу консалтинговых агентств и пару ссылок на платные базы данных. Нужного документа нет на первых трёх страницах. Возможно, он существует - просто Яндекс не знает, что вы ищете именно PDF именно того периода именно с конкретными словами в названии.
Это классическая ситуация, где операторы решают задачу за 15 секунд.
Яндекс обрабатывает запрос как набор слов и пытается угадать намерение. Операторы убирают угадывание - вы говорите поисковику точно, что искать и где. Разница между «найди что-нибудь похожее» и «найди вот это».
Базовый словарь: операторы, которые работают прямо сейчас
Начнём с простого. Каждый оператор - это слово или символ, который меняет логику поиска. Их можно комбинировать в одном запросе.
Кавычки " " - точная фраза
Самый недооценённый инструмент. Запрос "технологии сегодня" найдёт страницы, где эти два слова стоят рядом именно в таком порядке. Без кавычек Яндекс ищет страницы, где встречается хотя бы одно из слов - и выдаёт миллион результатов вместо тысячи нужных.
site: - поиск внутри конкретного сайта
site:rbc.ru инфляция - найдёт все материалы РБК про инфляцию. Работает лучше, чем встроенный поиск на большинстве сайтов. Особенно полезно на государственных порталах, где собственный поиск сломан или отсутствует.
filetype: - поиск по типу файла
filetype:pdf ограничивает выдачу только PDF-документами. Работает и с другими форматами: filetype:doc, filetype:xls, filetype:ppt. Яндекс индексирует содержимое документов - значит, можно искать по тексту внутри файла, а не только по названию страницы.
url: - слово в адресе страницы
url:doklad найдёт страницы, в адресе которых есть слово «doklad». Полезно, когда ищете разделы сайтов с отчётами, докладами, архивами - их часто называют именно так в URL.
title: - слово в заголовке страницы
title:"технологии сегодня" ищет страницы, где эта фраза стоит в теге заголовка. Это сильнее, чем просто поиск по тексту: если слова в заголовке - скорее всего, страница именно об этом, а не просто упоминает тему вскользь.
date: - ограничение по дате
Синтаксис: date:20050101..20071231 - найдёт документы, проиндексированные с 1 января 2005 по 31 декабря 2007. Формат: ГГГГММДД..ГГГГММДД. Можно указать одну дату - тогда ищет с этого момента до сегодня.
- (минус) - исключение слова
технологии -маркетинг уберёт из выдачи всё, что связано с маркетингом. Незаменимо, когда слово многозначное: ищете «Ягуар» как автомобиль - добавляете -животное -кошка.
| (вертикальная черта) - логическое «ИЛИ»
смартфон | телефон найдёт страницы, где встречается хотя бы одно из слов. Полезно, когда тема может называться по-разному.
~ (тильда) - синонимы
~дешёвый ноутбук расширит поиск на синонимы: «бюджетный», «недорогой», «экономичный». Яндекс сам подберёт близкие по смыслу слова.
От теории к практике: разбираем реальные запросы
Теперь собираем операторы в рабочие конструкции. Каждый пример - это задача, которую обычный поиск решает плохо или не решает вообще.
Задача 1: найти PDF с конкретными словами в названии за определённые годы
Запрос: title:"технологии сегодня" filetype:pdf date:20050101..20071231
Что происходит: Яндекс ищет только PDF-документы, у которых в заголовке стоит точная фраза «технологии сегодня», и отбирает только те, что были проиндексированы в период с 2005 по 2007 год. Вместо миллиона результатов - десятки, и все по делу.
Задача 2: найти открытые Excel-таблицы с данными по зарплатам
Запрос: filetype:xls "зарплата" "2023" site:gov.ru
Государственные сайты часто публикуют статистику в табличном формате, но не делают её очевидной. Этот запрос найдёт XLS-файлы на официальных порталах с нужными словами внутри. Аналогично работает для site:edu.ru - университетские данные, учебные планы, расписания.
Задача 3: найти страницы с конкретной фразой, исключив коммерческий мусор
Запрос: "открытый исходный код" title:руководство -купить -цена -скачать
Ищете техническую документацию, а Яндекс подсовывает магазины и лендинги? Минус-слова чистят выдачу радикально. Можно добавить несколько через пробел: -купить -цена -заказать -стоимость.
Задача 4: найти забытый материал на конкретном сайте
Запрос: site:habr.com title:"docker" date:20180101..20190101
Вы помните, что читали статью про Docker на Хабре примерно в 2018-2019 году, но не помните название. Этот запрос выдаст все материалы Хабра с «docker» в заголовке за тот период. Работает как личная машина времени по архивам сайта.
Задача 5: найти презентации по теме для подготовки к докладу
Запрос: filetype:ppt "цифровая трансформация" "промышленность" date:20210101..20231231
PowerPoint-файлы часто содержат структурированную информацию, которую не найдёшь в статьях: схемы, цифры, сравнения. Их публикуют на конференциях, в университетах, на корпоративных порталах - и Яндекс их индексирует.
Сложные комбинации: когда операторов несколько
Операторы работают вместе - и здесь начинается настоящий поиск.
Пример из практики: нужно найти открытые данные по экологической обстановке в конкретном регионе, опубликованные государственными структурами в виде документов.
Запрос: site:gov.ru | site:mnr.gov.ru "экологический мониторинг" "Краснодарский край" filetype:pdf date:20200101..20231231
Разбираем по частям:
- site:gov.ru | site:mnr.gov.ru - ищем на государственных сайтах или конкретно на сайте Министерства природных ресурсов
- "экологический мониторинг" - точная фраза, не просто похожие слова
- "Краснодарский край" - ещё одна точная фраза, фильтрует по региону
- filetype:pdf - только документы PDF
- date:20240101..20251231 - только свежие данные
Такой запрос в обычном режиме поиска не собрать никакими словами. Яндекс просто не поймёт, что вам нужно именно это пересечение условий.
Ещё один пример - поиск учебных материалов:
site:edu.ru | site:msu.ru filetype:pdf title:"лекция" "машинное обучение" -платно -курс
Университетские лекции в PDF, опубликованные на образовательных порталах, по теме машинного обучения - без коммерческих курсов в выдаче.
Где это реально полезно: сценарии из жизни
Операторы поиска - не игрушка для технарей. Вот ситуации, где они экономят час работы:
Журналисты и исследователи используют site: и filetype: для поиска первоисточников: официальных отчётов, статистики, протоколов. То, что пресс-служба не выложила на главную - часто лежит в глубине сайта и индексируется Яндексом.
Студенты и преподаватели находят через filetype:pdf site:edu.ru учебники, методички и лекции, которые официально доступны, но не рекламируются.
HR и рекрутеры применяют site: для поиска резюме на конкретных платформах или title: для поиска профилей с нужными словами в заголовке страницы.
Разработчики ищут через site:github.com или site:stackoverflow.com конкретные решения с нужными словами в заголовке обсуждения - быстрее, чем встроенный поиск этих платформ.
Все остальные - когда нужно найти старую статью, документ, инструкцию или прайс, которые точно существуют, но обычный поиск их не показывает.
Честно о ограничениях
Операторы - не волшебная палочка. Несколько вещей, которые стоит знать сразу.
date: в Яндексе работает по дате индексации, а не по дате публикации. Документ 2005 года, переиндексированный в 2020-м, может не попасть в выборку за 2005-2007. Это раздражает, но обойти сложно - просто учитывайте при интерпретации результатов.
filetype: иногда пропускает документы, если сайт закрыл прямой доступ к файлам. Яндекс индексирует то, что может прочитать - если файл за авторизацией, оператор его не найдёт.
Комбинация слишком многих операторов сужает выдачу до нуля. Если результатов нет - уберите один оператор и попробуйте снова. Поиск с операторами - это итеративный процесс, а не одна попытка.
И последнее: Яндекс периодически меняет поддержку операторов без объявлений. Большинство из перечисленных работают стабильно годами, но если что-то перестало работать - проверьте актуальную справку Яндекса.
Попробуйте прямо сейчас
Лучший способ убедиться - один рабочий запрос. Возьмите любую тему, которую вы искали последние недели и не нашли нормального первоисточника. Добавьте filetype:pdf и title: с ключевой фразой. Сравните с тем, что выдаёт обычный поиск.
Операторы поиска - это навык, который большинство людей никогда не осваивают, хотя он доступен всем и бесплатен. Разрыв между тем, кто умеет ими пользоваться, и тем, кто не умеет, - это разрыв в качестве найденной информации. Не в скорости печати, не в умении формулировать - именно в качестве.
Какой запрос вы бы хотели научиться составлять - поделитесь в комментариях, разберём конкретный случай.
Источник: Справка Яндекса - язык запросов
🔔 Подпишитесь на КликХак - здесь про инструменты, которые работают, а не про хайп вокруг новых гаджетов.