Технологии искусственного интеллекта сегодня применяются во многих сферах – образовании, медицине, транспорте и логистике, банковской сфере, в промышленности и торговле. Некоторые разработки могут существенно упрощать процессы в абсолютно разных организациях и компаниях. Например, к таким решениям относится платформа для оцифровки документов и распознавания изображений Beorg Smart Vision. Какие технологии лежат в основе платформы и как она помогает оптимизировать рутинные задачи, мы поговорили с Георгием Зуевым, основателем компании «Биорг», (резидент ИТ-кластера Фонда «Сколково»).
Умный помощник в работе с документами
К наиболее перспективным направлениям развития искусственного интеллекта можно отнести компьютерное зрение, машинное обучение и его отдельную большую ветвь – распознавание естественного языка, – нейросети, экспертные системы анализа и принятия решений на основе данных. Прогресс в этих исследовательских областях ведет к успеху и в прикладных решениях. Автоматическая рекомендация музыки и фильмов, диагностика заболеваний, распознавание и оплата по лицу, автоматизация производственного цикла и, конечно, оцифровка документов и перевод данных в машиночитаемый вид – все это успешно научились делать машины.
На основе технологий машинного зрения и нейросетей работает и платформа для оцифровки документов и распознавания изображений Beorg Smart Vision, которую разработал резидент Фонда «Сколково» компания «Биорг».
«Машинное зрение помогает системе переводить документ в машиночитаемый вид, нейросети “понимают” прочитанное, соотносят с нужными категориями и переносят информацию в базу данных. Чтобы обучать нейросетевой комплекс лучше распознавать информацию, в том числе рукописную, формируются наборы данных (датасеты), после чего они размечаются. Умение работать с большими данными позволяет нам предлагать востребованные практические решения на базе ИИ», – рассказывает Георгий Зуев
Обычный пользователь едва ли слышал о платформе «Биорг», поскольку компания работает с крупными корпоративными клиентами и государством. Однако реальную пользу от ее использования почувствуют многие.
«Представьте, вы пришли оформлять страховку жизни или кредит. Или, может быть, вам надо подать документы в МФЦ. Необходимо сформировать заявление, заполнить его вручную, приложить паспорт, СНИЛС и, в зависимости от услуги, – множество других документов. Эти данные должны попасть в информационную карточку базы данных коммерческой компании или госведомства. Как правило, информацию переносят вручную. На разные комплекты может уходить от 20 до 45 минут. В итоге время на рутинные процедуры тратит и сама компания, и клиент. Мы сокращаем время обработки до 5-7 минут для страховых компаний и до 10-12 минут для банков», – рассказывает Георгий Зуев.
Другой пример – обучение цифрового помощника «Ева» для Росреестра. Ведомство вышло на стадию опытных испытаний ИИ-системы для помощи государственным регистраторам. «Система анализирует комплект документов «договор + доверенность», переводит информацию в машиночитаемый вид и проверяет на ряд юридически значимых факторов. Это возможно за счет предобученных нейросетей, которые анализируют смысловые сущности, различая, например, покупателя, продавца и доверенное лицо. По прогнозам, благодаря системе снизится число отказов или приостановок регистраций прав на недвижимость», – уточняет эксперт.
Сколько можно сэкономить с помощью сервиса «Биорг»
Ручная обработка, например, кадровых документов, учитывая зарплату сотрудника, пенсионные и налоговые отчисления, стоимость рабочего места составляет порядка 300-400 рублей за комплект. Технологии оцифровки с применением искусственного интеллекта на текущем этапе позволяют сократить эту цифру до 120-150 рублей.
Для крупных организаций, которые работают с большим объемом документов, экономия может составлять десятки миллионов рублей в год. «Недавно мы просчитали эффективность процессов заказчика, который тратит около 45 млн рублей ежегодно на ручной перенос данных в систему и перепроверку их качества. При этом остаются проблемы ошибок и пропуска важных полей. Решение для автоматической обработки документов на базе ИИ способно снизить эту стоимость в 2 раза и более. Работа идет по принципу “отсканировал и забыл”. При этом заказчик избавляется от проблем “человеческого фактора”: нет ошибок в данных, обработка идёт в режиме непрерывности даже в периоды пиковых нагрузок – у компьютерного зрения нет перекуров, оно не устаёт от рутины», – отмечает Георгий Зуев.
Об ограничениях технологии
Как и у любой технологии у искусственного интеллекта есть ограничения в использовании. Датасет, на котором обучается система, должен быть качественным, промодерированным людьми, которые обладают специальными знаниями. «“Биорг” размечает данные на собственном ресурсе, привлекая к этому удаленно подключенных к краудсорсинговому «облаку» операторов ввода данных – граждан РФ из разных регионов. Всего у нас зарегистрировано около 50 тыс. операторов. Известны казусы, когда компании решили обойтись без ручной разметки данных. В результате банковские чат-боты, обученные на открытых, не прошедших модерацию данных, начинали хамить или угрожать клиентам», – добавляет Георгий Зуев.
Что дальше
По словам Георгия Зуева, до лета 2022 года в России не было комплексного «коробочного» решения корпоративного уровня для распознавания и анализа документов. После того, как часть вендоров приостановила работу в стране, отечественные разработчики получили существенную поддержку со стороны государства. «На базе технологий Beorg Smart Vision мы сейчас развиваем линейку продуктов, работающих on-premise, т.е. в контуре заказчика. Одним из них стал “Биорг.Документы”. Проект прошёл отбор в Центре компетенций по развитию российского общесистемного и прикладного программного обеспечения “Мультимедийное ПО” Минцифры. Следующий шаг развития мы связываем с поставками своего лицензионного ПО в дружественные страны».
При участии Фонда «Сколково», Российского экспортного центра и Минцифры компания «Биорг» прорабатывает проекты оцифровки для Узбекистана, Киргизии, ЮАР.