Корпорация ЭЛАР представила результаты применения технологий искусственного интеллекта для автоматизированной обработки патентных документов — одного из наиболее сложных и требовательных классов документов с точки зрения распознавания, анализа и извлечения данных. Патентная документация отличается высокой плотностью информации, сложной структурой, большим количеством таблиц, формул и графических элементов, а также строгими требованиями к точности извлечения реквизитов и контекстных связей. Именно поэтому такие документы традиционно считаются пограничным случаем для автоматизации и требуют зрелых ИИ-подходов. В отличие от типовых деловых или архивных документов, патенты сочетают многоуровневую структуру, разнообразие форматов представления данных и тесную взаимосвязь текста, таблиц и графики. Ошибки в извлечении ключевых сведений могут приводить не просто к потере информации, но и к искажению юридически значимого смысла документа. Для работы с такими массивами системе недостаточно прост
Когда OCR уже не справляется: как ИИ ЭЛАР работает с патентными документами
2 дня назад2 дня назад
3
2 мин