Найти в Дзене
ВЕДОМОСТИ

Как ИИ читает между строк

Цифровая трансформация диктует новые правила: объемы данных растут в геометрической прогрессии, а скорость их обработки становится ключевым конкурентным преимуществом. В этом контексте простой перевод бумажных документов в электронный вид уже недостаточен – бизнес стремится перейти к интеллектуальному анализу документов (ИАД). Это не просто оптимизация операционных затрат, а фундаментальный сдвиг в работе с информацией – создание новых возможностей для извлечения ценности из неструктурированных данных, которые долгое время оставались недоступными для анализа. По итогам 2024 г. объем российского рынка больших данных составил около 320 млрд руб., подсчитали в Ассоциации больших данных. Согласно прогнозу организации, к 2030 г. этот показатель может достичь 10,6 трлн руб. Значительная часть этой информации – по нашим данным, до 80% – остается неструктурированной: это бумажные архивы, сканы договоров, техническая документация, отчеты в PDF. При работе с большим объемом документов основные п
Оглавление

Цифровая трансформация диктует новые правила: объемы данных растут в геометрической прогрессии, а скорость их обработки становится ключевым конкурентным преимуществом. В этом контексте простой перевод бумажных документов в электронный вид уже недостаточен – бизнес стремится перейти к интеллектуальному анализу документов (ИАД). Это не просто оптимизация операционных затрат, а фундаментальный сдвиг в работе с информацией – создание новых возможностей для извлечения ценности из неструктурированных данных, которые долгое время оставались недоступными для анализа.

От механического к «умному» чтению

По итогам 2024 г. объем российского рынка больших данных составил около 320 млрд руб., подсчитали в Ассоциации больших данных. Согласно прогнозу организации, к 2030 г. этот показатель может достичь 10,6 трлн руб.

Значительная часть этой информации – по нашим данным, до 80% – остается неструктурированной: это бумажные архивы, сканы договоров, техническая документация, отчеты в PDF. При работе с большим объемом документов основные проблемы заключаются в высоком риске ошибок и их значительной стоимости. Это также усложняет поиск нужной информации и приводит к простоям и упущенной прибыли.

Традиционная оцифровка с помощью оптического распознавания символов (OCR) безнадежно устарела. Она механически превращает изображение в текст, но не «понимает» его смысла, не «видит» ошибок и не устанавливает связи между документами.

На смену OCR приходит интеллектуальный анализ документов – парадигма, в которой ИИ выступает как полноценный помощник. Он не только извлекает данные, но и анализирует их контекст, выявляет аномалии, строит причинно-следственные связи. Это позволяет сократить затраты и значительно повысить качество работы с документами, существенно снизить ошибки, а главное – трансформировать архив данных в стратегический ресурс для принятия обоснованных решений. Так, согласно внутренним исследованиям Т1, сотрудники, используя ИАД, тратят на сравнение документов в пять раз меньше времени, а за счет экономии времени персонала затраты снижаются на 40%. Время согласования договоров в юридическом отделе сократилось с двух недель до трех дней.

Что тормозит компании

Бизнес уперся в системные ограничения, которые старые технологии преодолеть не в состоянии. Проблема номер один – физический и экономический масштаб бумажных архивов. Крупный промышленный холдинг может хранить сотни тысяч единиц технической документации, а банк – миллионы сканов паспортов и заявлений. Их хранение, а тем более ручная обработка требуют колоссальных затрат на аренду помещений, персонал и управление.

Вторая проблема – дефицит квалифицированных специалистов, готовых заниматься кропотливым процессом верификации и разметки данных, это серьезно замедляет цифровую трансформацию. Рутинные операции отвлекают экспертов от аналитики и принятия решений, а найти и сохранить подходящих сотрудников трудно. Эту рутинную работу не хотят выполнять ни молодые специалисты, поскольку это не дает им экспертизы, ни их опытные коллеги, чье время стоит дорого и может быть направлено на более сложные задачи. При этом в крупных компаниях ручной анализ контрактов, заявок, отчетов и ведение деловой переписки может занимать, по нашим данным, до 80% рабочего времени линейных сотрудников.

Наконец, третье ограничение – устаревшая архитектура классических систем электронного документооборота и автоматизации просто не готова к масштабу современных задач. Она не позволяет гибко и эффективно внедрять новые интеллектуальные компоненты, масштабировать решения под растущие бизнес-потребности и обеспечивать современные требования информационной безопасности.

Эволюция от сканера к мыслителю

Интеллектуальный анализ документов – это не единая технология, а комплексный процесс, состоящий из нескольких взаимосвязанных когнитивных этапов. В отличие от простого OCR, который является лишь «зрением» системы, ИАД добавляет «мозг».

Так, на этапе распознавания система не просто оцифровывает текст – с помощью алгоритмов компьютерного зрения она идентифицирует и сегментирует все элементы на странице: печатные блоки, рукописные пометки инженера, штампы, печати, таблицы, графики и логотипы. Современные модели способны читать текст даже на низкокачественных сканах, под углом или с поврежденных оригиналов.

Затем следует этап классификации и извлечения данных – это ядро системы. Определив тип документа (договор, счет-фактура, технический паспорт, судебное решение и т. д.), алгоритмы естественной обработки языка приступают к извлечению фактов: имен, сумм, дат, реквизитов, статей законов, артикулов деталей. Ключевое отличие – понимание контекста: например, система отличает сумму аванса от суммы штрафа в одном и том же договоре.

Вслед за этим система ИАД приступает к валидации и установлению связей – это самый сложный этап, на котором ИИ проверяет извлеченные данные на непротиворечивость внутренним бизнес-правилам и внешним источникам (например, сверяет ИНН контрагента с государственным реестром). На основе обработанных документов система строит граф знаний, выявляя связи: какой поставщик связан с какими договорами, какие детали входят в какую сборку, какие судебные решения касаются определенной статьи кодекса.

В основе решений ИАД последнего поколения лежат большие мультимодальные модели ИИ (такие как GPT-4, LaMDA и их отечественные аналоги), способные одновременно обрабатывать текст, изображения и схемы в рамках одного контекстного окна. Их ключевое преимущество – возможность дообучаться на данных конкретной отрасли, что позволяет достигать высокой точности даже при работе с узкоспециализированной документацией. Например, модуль T1 «Анализ документов» использует подобные модели не только для поиска по смыслу и распознавания рукописного текста, но и для выявления смысловых несоответствий в разных версиях одного документа.

Как найти прибыль в старых чертежах

Нагляднее всего преимущества ИАД видны на комплексных отраслевых кейсах. Один из таких примеров – решение холдинга T1 для крупного машиностроительного предприятия.

За годы работы на предприятии скопился многотонный архив неоцифрованной конструкторской и технологической документации. Обработка такого объема силами десяти технических специалистов заняла бы более десяти лет. В доцифровую эпоху это оборачивалось колоссальными издержками: инженерам требовались дни, чтобы найти нужный чертеж для ремонта оборудования клиента, что приводило к многодневным простоям на производствах заказчиков, прямым убыткам и серьезным репутационным рискам для компании.

Для решения таких проблем подходит, например, программно-аппаратный комплекс (ПАК) на базе MLOps-платформы «Сайбокс» (MLOps – Machine Learning Operations, набор практик для управления жизненным циклом моделей машинного обучения). Он может проанализировать не только текст, но и схемы, условные обозначения, связи между элементами на чертеже. Помимо этого система учится на лету: интерфейс валидатора позволяет инженерам вносить правки, которые система сразу учитывает в дальнейшей работе.

Такие проекты могут привести к качественному изменению бизнеса. Они позволяют предприятиям быстрее проводить сервисное обслуживание, оптимизировать затраты на актуализированный каталог запчастей, минимизировать ошибки ввода данных в учетные системы.

Помимо IT-холдинга T1, который делает ставку на глубокую отраслевую адаптацию и комплексные ПАК для промышленности, на российском рынке ИАД представлены и другие игроки. «Ростелеком» традиционно фокусируется на крупных госконтрактах и банковском секторе, предлагая решения для обработки паспортов, заявлений и других документов. «ИКС Холдинг» разрабатывает корпоративные системы с повышенными требованиями к безопасности и отказоустойчивости. «Яндекс Облако» и VK Cloud Solutions действуют как поставщики API-сервисов (Application Programming Interface, или программный интерфейс приложения, – наборы функций и инструментов, которые позволяют различным программам и приложениям взаимодействовать друг с другом через интернет, обмениваясь данными. – «Ведомости. Технологии»), предлагая разработчикам и интеграторам «строительные блоки» для создания собственных решений, что популярно у стартапов и онлайн-сервисов.

Перспективы

Полагаю, что в ближайшие пять лет рынок интеллектуального анализа документов в России ждет взрывной рост, движимый несколькими трендами.

Первым среди них можно выделить гиперспециализацию моделей. Уйдут в прошлое универсальные решения «для всех типов документов». Доминировать будут готовые отраслевые модели, предобученные на специфичных данных, например, для юриспруденции (анализ судебной практики), машиностроения (чтение чертежей) или нефтегазовой отрасли (обработка геолого-разведочных отчетов).

Второй тренд – развитие генеративного ИИ, которое приведет к тому, что системы не только будут извлекать данные, но и интерпретировать их. ИИ сможет формулировать выводы, составлять аналитические справки, резюме договоров, генерировать ответные документы (запросы, претензии) и даже давать прогнозы по развитию бизнеса на основе выявленных тенденций.

ИАД также перестанет быть точечным инструментом и станет стандартным модулем, встроенным в ядро корпоративных систем.

Одним из сдерживающих факторов останется «принцип замусоренности на входе» – низкое качество оцифрованных исходников будет порождать ошибки в анализе. Кроме того, будут актуальны вопросы кибербезопасности при работе с конфиденциальными документами в публичных облаках.

Однако компании, которые смогут преодолеть эти барьеры и выстроить культуру работы с данными, получат доступ к мощнейшему инструменту для принятия решений, основанных на полной картине, а не на устаревших выжимках. Данные, годами пылившиеся на полках, начнут приносить прибыль.

Подпишитесь на «Ведомости» в Telegram

Читайте также:

Володин: Меркель и подобные ей желают России худшего

Как Трамп после Индии и КНР «продавливает» Турцию и Венгрию по нефти из России

В Госдуме сообщили о разработке проекта о перевозке детей в такси без переплаты