529 читали · 1 год назад
Поиск по содержимому документов (doc, xls, csv, rtf, pdf) Sphinx и PHP
Недавно в одном из проектов мне потребовалось решить задачу поиска по содержанию файлов популярных форматов, таких как doc, docx, xls, csv и pdf. В данной статье я хотел бы поделиться своим опытом написания скрипта на PHP для поиска по содержимому документа. Перед тем как продолжить хочу уточнить, в статье я не буду рассказывать как установить Sphinx. Все ниже изложенное написано с тем учетом, что система Sphinx уже установлена и настроена. Так как Sphinx напрямую не может работать с файлами форматов ...
156 читали · 2 года назад
Документы DOC и DOCX – что это и как открыть?
DOC VS DOCX DOC – это изначально бинарный и проприетарный тип файла, появившийся одновременно с релизом Microsoft Word более 30 лет назад. DOCX пришел на смену DOC в двухтысячных и в отличие от своего предшественника получил открытый формат, что дало возможность сторонним разработчикам включить его нативную поддержку в свои приложения. DOCX основан на Office Open XML и использует сжатие по алгоритму ZIP. Отсюда – еще несколько преимуществ: документы DOCX занимают значительно меньше места на жестком диске, одинаково отображаются в других редакторах, их легко читать и передавать...