Недавно в одном из проектов мне потребовалось решить задачу поиска по содержанию файлов популярных форматов, таких как doc, docx, xls, csv и pdf. В данной статье я хотел бы поделиться своим опытом написания скрипта на PHP для поиска по содержимому документа. Подготовка Перед тем как продолжить хочу уточнить, в статье я не буду рассказывать как установить Sphinx. Все ниже изложенное написано с тем учетом, что система Sphinx уже установлена и настроена. Так как Sphinx напрямую не может работать с файлами форматов ...
Парсинг — это сбор данных из открытых источников в интернете. Осуществляется автоматически специальными программами или онлайн-сервисами. На Авито можно собирать контакты авторов объявлений, цены на товары и услуги, мониторить предложения конкурентов. Делать это вручную — долго и неэффективно, удобнее использовать парсеры. Что такое парсер и какие данные можно собрать на Авито Программы и онлайн-сервисы, которые собирают данные с помощью скриптов и систематизируют по заданным критериям, называют парсерами...