Найти в Дзене
АйТи блог

Как искусственный интеллект работает с документами

Оглавление

Сегодня мы рассказываем о технологии класса text mining — интеллектуальной обработке документов.

Эта технология включает в себя: классификацию документов на основе методов машинного обучения, выделение в документах информационных объектов и фактов, проверку документов с помощью настраиваемых лексических шаблонов и правил, анализ текста — морфологический, синтаксический и семантический — и анализ структуры и построение иерархической модели документа.

Где использовать технологию

Везде, где применяется человеческий труд по чтению и пониманию неструктурированных документов или текстов, их обработке и структуризации, можно внедрить text mining в том или ином виде, будь то система «Антиплагиат» или ответы бота в чате. 

Основные области применения text mining это:

  • Процесс закупочной деятельности компаний
  • Техническая поддержка
  • Маркетинг
  • Модернизация и автоматизация работы существующих ИС
  • Правовая экспертиза
-2

Практическая польза

Преимущества использования технологии текстовой аналитики велики: это повышение скорости бизнес-процессов, связанных с обработкой документов,снижение нагрузки на персонал в части рутинных операций и повышение точности за счет исключения человеческого фактора.

В применении систем интеллектуальной обработки текста есть ещё один неочевидный плюс: сейчас компании стремятся к максимальной диджитализации и зачастую ставят IT-директорам отдельные KPI на внедрение интеллектуальных систем. 

-3

Сценарии использования

Сценариев использования технологии интеллектуальной обработки документов немало.

  • Автоматизация интеллекта информационных систем: автоматический ввод атрибутов документа в СЭД/CRM, автосогласование и маршрутизация документов в СЭД, выявление и исправление дубликации справочников и их синхронизация, нормализация данных для big data, сбор информации для аналитических отчётов.
  • Правовая экспертиза: автоматический анализ рисков и ошибок в договорах, конструктор доверенностей и аналитических записок, поиск по базам судебных решений и прецедентов, повышение качества документов путём выявления и исправления типовых ошибок, оформление документов в полном соответствии с требованиями.
  • Автоматическая обработка запросов регуляторов в организации: выделение нужных данных из общего потока входящих запросов, распознавание содержания запросов и направление их ответственным лицам, огромное увеличение скорости обработки запросов.
  • Обработка входящей клиентской документации в банках: автоматическое определение типа каждого документа, проверка комплектности и принадлежности, извлечение реквизитов, корректное заполнение всех форм, проведение дополнительных проверок, составление проекта письма-ответа с промежуточными и конечным результатами рассмотрения заявки.
  • Анализ и обработка входящих обращений граждан: присвоение обращению категории или тематики, адресная привязка, направление в профильное подразделение или ответственному сотруднику, контроль исполнительской дисциплиной при рассмотрении запросов.
  • Классификация обращений в Service Desk: распределение заявок на вторую линию техподдержки, интеграция сервисов текстового майнинга с Service Desk.
  • Автоматизация рассмотрения заявок по закупкам: автоматизация обработки пакетов документов участников тендера, типизации документов, проверки комплектности, кроссверки, проверки соответствий ТКП и ТЗ.
-4

Уникальная разработка от ГК Аплана

Наша платформа интеллектуальной обработки текстов Preferentum использует лучшие достижения в области компьютерной лингвистики и аналитики. 

На базе технологии создан целый ряд прикладных решений и сервисов в области аналитики неструктурированной информации, которые сегодня успешно эксплуатируются крупными российскими заказчиками.

Мария Ажнина
Автор блога АйТи