Недавно в одном из проектов мне потребовалось решить задачу поиска по содержанию файлов популярных форматов, таких как doc, docx, xls, csv и pdf. В данной статье я хотел бы поделиться своим опытом написания скрипта на PHP для поиска по содержимому документа. Подготовка Перед тем как продолжить хочу уточнить, в статье я не буду рассказывать как установить Sphinx. Все ниже изложенное написано с тем учетом, что система Sphinx уже установлена и настроена. Так как Sphinx напрямую не может работать с файлами форматов ...
Сразу оговорюсь, что я не рекламирую этот продукт за вознаграждение. Просто делюсь полезной на мой взгляд программой.
DocFetcher – это приложение с открытым исходным кодом, позволяющее вам совершать поиск по содержимому файлов на вашем компьютере. Приложение работает на Windows, Linux и OS X.
Не буду расписывать все прелести данной программы, всё это можно почитать, а также скачать программу тут.
Расскажу предысторию, зачем она мне понадобилась и как я обнаружил это чудо.
У меня на компе скопилось достаточное количество технической документации, литературы по электронике, даташитов и схем...