Три года назад отечественные компании столкнулись с серьезным потрясением — уходом из России международных вендоров программного обеспечения. Это стало настоящим вызовом не только для потребителей ПО, но и для производителей технологий и продуктов. Особенно остро на случившееся отреагировала отрасль технологий распознавания, где основная доля рынка принадлежала компании ABBYY.
До 2022 года ABBYY была лидером в сфере технологий оптического распознавания в России. Компания прославилась своими продуктами Abbyy FineReader, Abbyy Lingvo и представляла также решения для бизнеса ABBYY FlexiCapture — системой, которая использовалась для оцифровки бумажных документов и интеллектуальной обработки информации. Решение автоматически извлекало данные из документов и для ввода их в корпоративные информационные системы. Крупным корпорациям это давало возможность гибко и удобно управлять всей информацией в едином потоке.
В 2022 году ABBYY объявила о прекращении продаж продуктов и услуг на территории России. Компания также удалила из реестра отечественного ПО Минцифры РФ два десятка своих продуктов, которые повсеместно использовались госкорпорациями и крупным бизнесом. В том числе из реестра был исключен продукт Abbyy FlexiCapture.
Когда ABBYY свернула свою деятельность в России, отечественные компании столкнулись с серьезной проблемой: системы распознавания ABBYY было практически нечем заменить. Отечественные продукты сильно уступали FlexiCapture как по точности распознавания, так и по удобству использования, надежности и другим параметрам. Перед российской ИТ-отраслью была поставлена амбициозная, но крайне сложная задача — импортозаместить программное обеспечение для бизнеса, предназначенное для оптического распознавания документов.
Российский аналог должен был покрывать основной функционал FlexiCapture. А именно, уметь автоматически определять тип документа; распознавать печатные и рукопечатные (написанные рукой отдельными буквами) реквизиты; находить чек-боксы; извлекать данные таблиц из документов; проверять подписи и печати. При этом важно, чтобы продукт интегрировался с различными информационными системами.
Однако и это еще не все. Импортозаместить не значит просто создать похожую программу. Процесс замены иностранного программного обеспечения отечественным предполагает целый комплекс мер, к которому предъявляется множество законодательных требований. Поскольку речь идет о технологиях, которые используются в том числе стратегически значимыми предприятиями, ключевую роль играют вопросы независимости и безопасности технологий. Все это должно учитываться при разработке решения, в части отказа от использования ПО западных разработчиков.
Все это удалось учесть в своих разработках ученым из компании Smart Engines, которая сегодня уверенно занимает место одного из самых сильных игроков на рынке оптического распознавания в РФ. Специалисты компании Smart Engines, которая уже 10 лет является лидером по технологиям распознавания паспорта и других удостоверяющих документов РФ и всех стран мира известна разработали ПО для ввода данных из первичных бухгалтерских, кадровых и других бизнес-документов для автоматизации документооборота. Это решение базируется на передовых сверхлегких нейросетях и не только не уступает зарубежным аналогам, но и превосходит их — в частности, в вопросе скорости и качества распознавания, поддержке распознавания прямо на мобильных устройствах и возможности распознавания рукописного текста.
Компания предлагает сразу несколько продуктов, которые направлены на закрытие потребностей бизнеса и государства в системах распознавания документов. К ключевым пакетным решениям для распознавания широкого класса документов для бизнеса относятся Smart Document Engine и Smart Text Engine.
Smart Text Engine — это уникальная OCR-система на базе искусственного интеллекта, предназначенная для автоматизации документооборота. Она распознает любые текстовые документы на более чем 100 языках мира, от служебных записок до договоров, и извлекает из них текстовую информацию. Решение поддерживает все виды текстовых документов вне зависимости от шрифта и распознает не только печатный, но и рукописный текст, в том числе надписи и пометки. Причем справляется с этим практически мгновенно: скорость распознавания в серверных решениях достигает 1800 страниц в минуту или 30 страниц в секунду.
Smart Engines также предлагает продукт для распознавания и извлечения реквизитов из структурированных документов — Smart Document Engine. Эта библиотека подпрограмм (SDK) подходит для работы с бланками и формами, от счетов на оплату до актов, накладных и передаточных документов, и выделения реквизитов из деловых документов. Как и Smart Text Engine, решение распознает любые текстовые данные, однако здесь на выходе пользователь получает уже не просто строки оцифрованного текста, а полноценные реквизиты. Продукт особенно полезен для бизнеса, перед которым стоит задача систематизации данных из больших потоков бухгалтерских и учетных документов — актов, УПД, счетов-фактур, форм ТОРГ-12, накладных, выписок из ЕГРЮЛ, налоговых деклараций, финансовых отчетов, приказов, уставов и прочих форм. Актуальная версия Smart Document Engine поддерживает более 70 преднастроенных шаблонов документов и позволяет самостоятельно настраивать шаблоны распознавания в дизайнере форм.
Для распознавания удостоверяющих документов у Smart Engines есть Smart ID Engine 2.0 — библиотека подпрограмм (SDK) для высокоточного и безопасного распознавания данных паспорта РФ и еще более 3000 типов удостоверяющих документов более чем 200 юрисдикций мира на фотографиях, сканах и в видеопотоке. Система автоматически распознает все страницы и данные паспорта РФ и других документов, находит все штампы и может обрабатывать видео, сканы и фотографии документов на мобильных устройствах, стационарных компьютерах, серверах и даже в веб-браузерах.
Преимущество продуктов Smart Engines в том, что системы распознавания работают полностью автономно на конечном устройстве: смартфоне, планшете, умной камере, терминале, персональном компьютере, сервере и даже в браузере. Данные не передаются на сторонние сервисы и не сохраняются. Для работы системы также не требуется доступ в интернет. Вся обработка документов ведется локально на устройстве клиента, что позволяет обеспечить сохранность данных и соблюдение требований законодательства по их обработке.