Сегодня мы рассказываем о технологии класса text mining — интеллектуальной обработке документов.
Эта технология включает в себя: классификацию документов на основе методов машинного обучения, выделение в документах информационных объектов и фактов, проверку документов с помощью настраиваемых лексических шаблонов и правил, анализ текста — морфологический, синтаксический и семантический — и анализ структуры и построение иерархической модели документа.
Где использовать технологию
Везде, где применяется человеческий труд по чтению и пониманию неструктурированных документов или текстов, их обработке и структуризации, можно внедрить text mining в том или ином виде, будь то система «Антиплагиат» или ответы бота в чате.
Основные области применения text mining это:
- Процесс закупочной деятельности компаний
- Техническая поддержка
- Маркетинг
- Модернизация и автоматизация работы существующих ИС
- Правовая экспертиза
Практическая польза
Преимущества использования технологии текстовой аналитики велики: это повышение скорости бизнес-процессов, связанных с обработкой документов,снижение нагрузки на персонал в части рутинных операций и повышение точности за счет исключения человеческого фактора.
В применении систем интеллектуальной обработки текста есть ещё один неочевидный плюс: сейчас компании стремятся к максимальной диджитализации и зачастую ставят IT-директорам отдельные KPI на внедрение интеллектуальных систем.
Сценарии использования
Сценариев использования технологии интеллектуальной обработки документов немало.
- Автоматизация интеллекта информационных систем: автоматический ввод атрибутов документа в СЭД/CRM, автосогласование и маршрутизация документов в СЭД, выявление и исправление дубликации справочников и их синхронизация, нормализация данных для big data, сбор информации для аналитических отчётов.
- Правовая экспертиза: автоматический анализ рисков и ошибок в договорах, конструктор доверенностей и аналитических записок, поиск по базам судебных решений и прецедентов, повышение качества документов путём выявления и исправления типовых ошибок, оформление документов в полном соответствии с требованиями.
- Автоматическая обработка запросов регуляторов в организации: выделение нужных данных из общего потока входящих запросов, распознавание содержания запросов и направление их ответственным лицам, огромное увеличение скорости обработки запросов.
- Обработка входящей клиентской документации в банках: автоматическое определение типа каждого документа, проверка комплектности и принадлежности, извлечение реквизитов, корректное заполнение всех форм, проведение дополнительных проверок, составление проекта письма-ответа с промежуточными и конечным результатами рассмотрения заявки.
- Анализ и обработка входящих обращений граждан: присвоение обращению категории или тематики, адресная привязка, направление в профильное подразделение или ответственному сотруднику, контроль исполнительской дисциплиной при рассмотрении запросов.
- Классификация обращений в Service Desk: распределение заявок на вторую линию техподдержки, интеграция сервисов текстового майнинга с Service Desk.
- Автоматизация рассмотрения заявок по закупкам: автоматизация обработки пакетов документов участников тендера, типизации документов, проверки комплектности, кроссверки, проверки соответствий ТКП и ТЗ.
Уникальная разработка от ГК Аплана
Наша платформа интеллектуальной обработки текстов Preferentum использует лучшие достижения в области компьютерной лингвистики и аналитики.
На базе технологии создан целый ряд прикладных решений и сервисов в области аналитики неструктурированной информации, которые сегодня успешно эксплуатируются крупными российскими заказчиками.
Мария Ажнина
Автор блога АйТи