Найти тему

Доступен новый выпуск Paperless-ngx, веб-приложения для работы с документами, которое преобразует бумажные документы в электронные, доступные для полнотекстового поиска, скачивания и хранения онлайн. Код написан на языке Python с использованием фреймворка Django и распространяется под лицензией GPLv3. Для ознакомления с возможностями системы подготовлен демонстрационный сайт demo.paperless-ngx.com (логин/пароль - demo/demo).


Paperless-ngx является ответвлением от проекта paperless-ng, который, в свою очередь, ответвился от оригинального проекта paperlsess (форки создавались для продолжения разработки после прекращения сопровождения прошлыми разработчиками). После загрузки отсканированного документа любым доступным способом (по FTP, через веб-интерфейс, через Android-приложение, по электронной почте через IMAP), программа осуществляет оптическое распознавание текста (OCR), используя движок Tesseract, далее в интерфейсе доступно тегирование (в том числе автоматическое с использованием машинного обучения), полнотекстовый поиск, а также загрузка версии документа в формате PDF/A или в форматах офисных пакетов.

Около минуты
144 читали