Найти в Дзене
Наши сервисы

Наши сервисы

Как происходит распознавание паспорта, какие нейросети мы тренируем и где может пригодиться сверка лиц
подборка · 5 материалов
2 года назад
Рефлексия разработчика: как мы переписали ядро продукта с нуля и что из этого вышло
Мы переписали наш продукт за новогодние праздники. Таким мог быть заголовок, но кликбейт не в нашем стиле, и пока мы писали статью и допиливали новую версию наступил июль. Привет, меня зовут Давид. Я тимлид команды разработки и мы уже встречались в статьях раньше. В этой буду рассказывать про ядро системы для обработки документов. Про DOCR-4. Вы можете спросить как расшифровывается DOCR. И я вам отвечу: Documents Optical Character Recognition. Но есть ещё такие версии: Dbrain Optical character recognition и Doc(ument) R(ecognition)...
2 года назад
Интеллектуальная обработка документов или Как мы научились распознавать сочинения ЕГЭ
Когда начали работать с государственными организациями, открыли для себя много нового. Нейросети узнали ещё больше. В статье рассказали про IDP и кейсы, которые нам запомнились, а дизайнер очень постарался всё это показать. Что такое IDP, чтобы не лезть в гугл IDP — это интеллектуальная обработка документов. Чем она хороша? IDP ищет и извлекает неупорядоченные данные из физических и электронных документов и преобразовывает их в структурированные. Процессами рулят ИИ и машинное обучение. Где использовать IDP популярна...
2 года назад
Что такое HITL и как он помогает распознавать документы
Каждый год машинное обучение становится более совершенным. Сейчас так вообще. Но концепция: чем больше обучающих данных, тем лучше производительность — будет работать всегда независимо от степени развития ИИ. Чтобы нейросеть училась быстрее и меньше ошибалась, нужна помощь человека — такой подход называется HITL, или ручное распознавание. Рассказываем про него подробнее. Что такое HITL Human-in-the-loop (HITL) — это подход, когда алгоритмы на основе машинного обучения работают вместе с людьми в реальном времени...
2 года назад
Привет, мы компания Dbrain и это пост-знакомство. Мы превращаем документы в цифровые данные с помощью ИИ. Если проще — распознаём любые виды документов, чтобы вам не приходилось ручками перебивать данные паспорта или любой другой важной бумажки. Кроме распознавания мы умеем: - определять фрод — это когда кто-то своё лицо прифотошопил к чужому паспорту и думал, что никто не заметит, (ну и другие случаи фотошопа и документомарания) - распознавать рукописный текст, даже если написано слово «шиншилла» - распознавать и сравнивать лица - определять жив ли человек, фотографии которого нам прислали, а то знаете, всякое бывает. В запасе есть ещё несколько сервисов, но это уже останется изюминкой для клиентов. Точность распознавания — до 99,5%. Этого достаточно, чтобы закрыть большинство задач. Точность можно повысить, если алгоритму помогут верификаторы — вместе они доводят качество распознавания до максимума. Ну и напоследок пара слов про безопасность: наша система может работать в облаке или в контуре клиента. Для обработки данных мы используем только временные хранилища, а наши серверы расположены на территории РФ. А ещё наш тимлид разработки сказал, что можно говорить про время распознавания. Теперь не 3, а 1-1,5 секунды. Но об этом расскажем попозже.
2 года назад
Вжух — и распозналось: как на самом деле работают алгоритмы распознавания документов
Результат есть, а как оно там распознаётся, никто и не представляет. Решили на пальцах, паспорте и алгоритмах Dbrain рассказать, как происходит волшебство. Хотя «Вжух» нам тоже нравится. Привет, мы компания Dbrain. Распознаём документы и превращаем информацию в цифровые данные с помощью ИИ. В месяц распознаем более 500 тыс. паспортов для разных клиентов и их нужд. Банки хотят знать кому дают кредит или оформляют счёт. Крупным компаниям нужно быстро нанимать новых сотрудников. Dbrain тот самый пластырь,...