Paperless — приложение для оцифровки, хранения и систематизации любых бумажных документов.
Это серверное приложение используется во многих крупных компаниях для обмена документации. Помимо помощи в организации отсканированных документов это приложение обладает обширными возможностями.
Это распознавание текста в ваших документах, с возможностью поиска даже в документах, отсканированных только в формате изображения. При этом, благодаря использованию движка Tesseract, приложение справляется с более чем 100 языками мира.
В приложение встроена функция машинного обучения, которая позволяет автоматически назначать теги, типы и так далее к документам.
Поддерживает документы PDF, изображения, текстовые файлы, документы Office (такие как Word, Excel, Powerpoint и LibreOffice и их аналоги) и многое другое.
Неплохой веб-интерфейс, с уже встроенным поиском, фильтрами и так далее. К тому же полностью на русском языке. А внутренняя система проверки работоспособности приложения вселяет уверенность, что с вашим архивом ничего не случится.
В целом приложение не плохое. А небольшой гайд по установке сервера с этим приложением на ОС Debian можете найти здесь: RoadIT.ru. Чуть позже дополню этот гайд и другими ОС.