Данная статья адресована в основном владельцам каналов Яндекс Дзен.
Иногда поиск какого-либо текста становится актуален для контроля дубликатов информации. Если публикаций на вашем канале довольно много, в какой-то момент может возникнуть желание проверить, писали ли вы уже на какую-то тему, упоминали ли какую-то вещь или человека, с какой степенью подробности и тому подобное.
В этой ситуации вы можете просто воспользоваться стандартными поисковиками, такими как Яндекс или Гугл. Разумеется, такой поиск может быть неудобен и ненадёжен, так как не ясно, насколько далеко в результатах поиска может оказаться нужная вам ссылка, и сможете ли вы вообще её найти.
Существуют инструменты расширенного поиска, когда в поисковике можно задать URL конкретного сайта, по которому следует производить поиск. Такие инструменты есть и в Яндекс, и в Гугл. К сожалению, в случае с URL конкретного канала эти инструменты не работают. Иными словами, URL канала Яндекс Дзен типа https://zen.yandex.ru/classical_guitar вообще не обрабатывается поисковыми системами как "сайт", в пределах которого можно осуществлять поиск (во всяком случае, на момент написания этой статьи).
Таким образом, чтобы надёжно искать информацию на собственном канале, вам придётся выкачать его на собственный компьютер, создав таким образом его локальную резервную копию, и искать уже там.
Это можно проделать, например, с помощью бесплатного программного обеспечения HTTrack. Это абсолютно бесплатная программа (лицензия GNU GPL), которую вы можете легко скачать и установить с официального сайта, предназначенная специально для подобных целей — создания локальных копий интернет сайтов. Программа имеет русский интерфейс, и абсолютно проста в использовании — всё можно сделать интуитивно.
Выкачивание канала с помощью HTTrack
На первом этапе нужно задать произвольно имя проекта и выбрать папку назначения:
На втором этапе нужно выбрать тип загрузки, указать путь к файлу со списком URL и задать параметры закачки.
Если вы закачиваете канал в первый раз, тип загрузки логично выбрать "Загрузить сайт(ы)". В дальнейшем тип загрузки можно выбирать "Обновить существующую закачку".
Файл со списком URL — обычный текстовый файл, который содержит в каждой строке URL конкретной статьи вашего канала. О том, как его получить, будет разговор ниже.
Настроек параметров закачки много, но в нашем случае будут важны только две:
"Макс. глубина" — 1 и "Максимальная глубина внешних" — 0. При таких параметрах не будет закачано ничего лишнего, только тексты статей.
Теперь о том, как получить файл со списком URL ваших статей. Для этого нужно зайти в раздел "Статистика" вашего канала, получить отчёт за нужный вам период (в первый раз — с момента начала ведения канала, чтобы список статей был полным), и скачать этот отчёт в формате Excel. Открыв отчёт на своём компьютере, вы можете скопировать содержимое колонки "Ссылка на публикацию", которая и содержит нужные вам URL. Сделать это можно, например, выделив нужный диапазон ячеек и нажав Ctrl + C. Затем запустите любой текстовый редактор, нажмите Ctrl + V и сохраните текстовый файл. Этот файл вам и нужно будет выбрать в параметре "URL list (.txt)" на втором этапе выше.
И наконец, на третьем этапе работы в HTTrack вам нужно только нажать кнопку "Готово", и закачка начнётся.
В дальнейшем, когда в следующий раз вы поставите тип загрузки "Обновить существующую закачку", ваш список URL в текстовом файле может содержать уже не все статьи канала, а только новые, полученные точно так же из "Статистики" вашего канала, за выбранный вами какой-либо последний период.
Собственно поиск
Результатом работы HTTrack будет папка с html-файлами, поиск по которой можно осуществлять, в частности, стандартными средствами Windows. Например, можно открыть эту папку в Проводнике и нажать F3 (или Ctrl + F).
Для Windows 7 есть один важный нюанс: чтобы такой поиск осуществлялся по содержимому файлов, а не только по их названиям, нужно специальным образом проиндексировать данную папку. Windows предложит это сделать при первой попытке поиска в ней.
Возможно, будет удобнее это сделать для всех папок сразу. Для этого в окне Проводника нужно выполнить команду меню "Упорядочить" - "Параметры папок и поиска", а в открывшемся окне на вкладке "поиск" установить флажок "Всегда искать по именам файлов и содержимому":
Удобство стандартного поиска Windows может устроить не всех, и в этом случае можно воспользоваться специализированными программами для поиска по содержимому файлов.
DocFetcher — абсолютно бесплатная программа для такого поиска (лицензия EPL). Её можно скачать с официального сайта даже в портативной версии, не требующей установки (будет нужна только распаковка). Эта программа выдаёт результаты поиска в более удобном чем сам Windows виде, в частности, с предпросмотром найденных файлов:
Если вы считаете информацию полезной, обязательно ставьте лайк — это продлевает "жизнь" публикации в ленте Дзена. А по следующей ссылке — Классическая гитара, путеводитель по каналу.
В любой непонятной ситуации — играйте на гитаре!