Итак, вторая часть обзора!
В ней мы, как обещали, остановимся на корпоративных продуктах Content AI и подробнее расскажем об их ИИ-«фишках».
Основные ИИ-инструменты редактора Content AT
ContentCapture (https://contentai.ru/contentcapture) – это комплексное решение для автоматизации обработки данных из различных источников — от бумажных документов до электронных писем и вложений, а также фотографий и прочих файлов. Программа поддерживает кросс-платформенность, что делает её подходящей как для внутренних бизнес-решений, так и для многообразной корпоративной среды.
Возможности решения включают распознавание документов, автоматическое извлечение данных, их классификацию и проверку на корректность. ContentCapture позволяет обрабатывать в едином потоке файлы как в офисных форматах (Word, Excel, PDF), так и электронные сообщения, отсканированные изображения и другие цифровые документы.
ИИ-функции продукта позволяют распознавать рукописный текст, автоматически улучшать изображения, что важно, когда документы все чаще представляют собой снимки со смартфонов или имеют различные защитные элементы, ухудшающие считывание информации. Все это снижает необходимость ручной предварительной подготовки документов и их последующей проверки и дополнительной обработки.
За счет применения low-code/no-code в IDP-платформе ContentCapture возможна автоматическая разметка документа и обучение системы на небольшом количестве примеров.
ContentReader Server (https://contentai.ru/contentreader-server) представляет собой мощное серверное решение, направленное на автоматическую обработку документов для корпоративного сектора. Благодаря ему компании могут быстро распознавать и конвертировать изображения в различные форматы, например PDF/A для архива, Microsoft Word для редактируемости и т.п., что делает информационные данные легко доступными и структурированными. Это повышает эффективность управления документооборотом за счет минимальных затрат времени на поиск необходимых данных или подготовку отчетов.
ИИ-возможности включают в себя улучшения для работы с PDF, позволяя улучшать текст низкого качества, сохранять закладки из оригиналов документов, обрабатывать файлы с цифровой подписью, возможность распознавать исторические шрифты, включая старопечатные и готические символы и автоматическое определение типов документов и их атрибутов.
В копилку возможностей стоит добавить более 190 языков распознавания, работу с 1D и 2D штрихкодами и поддержку большого количества форматов как текстовых, так и графических файлов.
ContentReader Engine SDK (https://contentai.ru/for-sdk) — многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания документов, изображений, фотографий, классификации документов, сохранение сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.
Content AI Intelligent Search(https://contentai.ru/intelligent-search) — это готовое решение для создания корпоративного поискового портала. Оно позволяет объединить все источники хранения данных для обеспечения сквозного поиска и навигации по всем видам информации. Система выполняет интеллектуальный поиск не только по точному совпадению с запросом, но и по смыслу. За счет встроенной технологии OCR обеспечивается поиск по PDF-документам и другим файлам в графических форматах.
В настоящий момент Intelligent Search постепенно становится платформой для создания цифровых ассистентов на базе больших языковых моделей и создания RAG на основе баз знаний из документов компании.
Импортозамещающая совместимость и безопасность
Раз продукты Content AI нацелены на импортозамещение, то что у них с совместимостью? Компания вовсю тестирует и адаптирует свои продукты под российские операционные системы и другие решения, даже не самые распространенные. ContentCapture совместима с РЕД ОС, Astra Linux, серверной ОС Platform V SberLinux OS Server от СберТех и ECM-платформой Documino. ContentReader Server изначально разрабатывался как кросс-платформенное решение, устанавливаемое на современные 64-битные операционные системы. OCR-технологии Content AI также совместимы с системой управления процессами и данными Docsvision.
Касаемо безопасности. Как мы ранее упоминали, за счет локального развертывания решений данные не утекают за корпоративный контур безопасности.
А что по использованию корпоративными клиентами?
Хоть компания на рынке и не так долго, но продукты Content AI уже имеют положительный опыт использования. Например, в Московском авиационном институте (МАИ) решения Content AI применяются для обработки лекций и презентаций. Система позволяет быстро распознавать отсканированные конспекты, редактировать их и превращать в цифровые учебные материалы. А Ростелеком успешно перешел на интеллектуальный редактор ContentReader PDF, тем самым полностью заменив иностранное ПО отечественным продуктом. Есть и другие крупные заказчики (клиника ЛРЦ, Министерство экономического развития и другие), но там процесс внедрения и обкатки продуктов еще продолжается.
Каков итог?
Content AI — это одна из немногих российских компаний, продукты, которой могут полноценно заменить решения Adobe Acrobat, ABBYY FineReader PDF и другие OCR и PDF-редакторы. Ее продукты удобны, функциональны, безопасны и активно завоевывают рынок, особенно в условиях импортозамещения. Благодаря корпоративным возможностям и интеграции с ИИ, решения Content AI становятся полноценной системой для автоматизированной обработки документов и создания интеллектуальной системы документооборота компаний.
Если вы пропустили первую часть обзора, ее можно прочитать тут
Делитесь мнениями и комментариями, нам это важно!