Найти тему
Версия

Механический турок

Оглавление
Сервисы распознавания документов: бизнес резидентов Сколково и схема 18 века (фото: Wikimedia Commons/ Karl Gottlieb von Windisch)
Сервисы распознавания документов: бизнес резидентов Сколково и схема 18 века (фото: Wikimedia Commons/ Karl Gottlieb von Windisch)

В этом материале попробуем разобраться как устроены сервисы распознавания и на чем строится их бизнес. Попробуем разобраться как с такими сервисами связана афера 18 века с шахматным автоматом, получившим название механический турок (Mechanical Turk). Схема заключалась в том, что в шахматы играл спрятанный в этом автомате маленький человек. Это устройство имело внешнюю показную сложность и легко вводило людей в заблуждение.

Для начала определимся, что такое сервис распознавания и что не является сервисом распознавания. Если компания для извлечения данных используют труд верификаторов и, по сути, оказывает услугу, в ходе которой изображения и данные от клиента поступают на обработку на ее сервера или внешние ресурсы, где и работают операторы, то это классический сервис распознавания. Соответственно, если компания передает заказчику только программное обеспечение для распознавания документов и ни в каком виде данные на обработку от клиентов к себе не получает, то выходит, что компания является не сервисом распознавания, а поставщиком ПО.

В настоящий момент на российском рынке можно выделить 2 сервиса, которые специализируются исключительно на вводе данных из документов и про которые активно говорят в новостях: это уже названная компания Биорг (Beorg Smart Vision) и компания Дибрейн (Dbrain). Обе являются резидентами Сколково. И как уже было сказано выше, их объединяет, то, что они используют при переводе данных из бумажных документов в цифровой вид человеческий труд. К поставщикам ПО относятся ушедшая в США после 30 лет работы в России компания Abbyy (сейчас ее российская «наследница» для работы в нашей стране компания Content AI принадлежит турецкой компании) и созданная в 2016 году российская компания Smart Engines. В этом материале рассматривать их смысла не имеет так как они представляют собой классические продуктовые ИТ-компании с понятной бизнес-моделью, завязанной на лицензирование ПО.

Люди в ящике

Во времена Новой истории существовала масса фальсификаций, связанных с поисками «вечного двигателя». В России традиции подобного мошенничества, увы, давние. В частности, в 19 веке, один «изобретатель» демонстрировал повозку, двигавшуюся якобы на вечном двигателе. На самом деле, внутри, как и в шахматном автомате, сидели двое мужчин, управлявших ею с помощью педального механизма. С наступлением темноты они вылезали из повозки где-нибудь в безлюдном месте и скрывались в ближайших кустах. Утром все повторялось снова.

Сейчас складывается впечатление, что история в очередной раз идет по спирали, если посмотреть на отечественные сервисы распознавания на базе нейросетей для перевода документов из бумажной в электронную форму. Представленные резидентами Сколково компаниями Биорг и Дибрейн сервисы распознавания на уровне своей технологии зачастую опираются на дополнительный труд расшифровщиков, как правило, работающих удаленно и нередко за рамками их штата сотрудников. Их деятельность нужна для того, чтобы исправлять вручную ошибки «автоматики» по переводу из бумажного формата в цифровой и то, что ИИ технологии не смогли распознать вообще. В последнем случае, ввод видимо становится полностью ручным. То есть сервисная модель позволяет скрыть автоматическую составляющую процесса распознавания, так как заказчик не знает, что делается нейросетью, а что руками операторов сервиса. Тут мы и начинаем отчетливо видеть контуры нашей повозки из 19 века и, конечно, механического турка.

Что ж, немного разобравшись в технологии работы сервисов распознавания документов, давайте посмотрим на цифры и бизнес-результаты этих решений по автоматизации.

Биорг

Компания ООО «Биорг» (ИНН 7724396261) последние 2 года балансирует на грани убыточности. За 2021 год она получила убыток, в 2022 году прибыль в 5 млн руб для штата более 50 человек небольшая.

-2

Среди наиболее вероятных причин таких показателей можно выделить две. Во-первых, это уменьшение количества государственных контрактов в 2021-2022 годах. Самым крупным контрагентом для компании стало Управление ЗАГС Кабинета Министров Республики Татарстан. Сумма этого контракта в 2020 году составила 649 884 686,77 руб. Всего на работы по оказанию услуг по переводу в электронную форму книг государственной регистрации актов гражданского состояния (заказчиками выступали ЗАГСы и администрации) пришлось 26 из 39 госконтрактов на сумму 1 266 млн руб. Эта цифра практически равна всей выручке компании с момента основания и до 2022 года включительно (выручка получилась больше на 13 млн руб). Это отчасти объясняется тем, что по данным портала госзакупок не все из госконтрактов были выполнены. Так контракт с Управлением ЗАГС Кабинета Министров Республики Татарстан был расторгнут в 2021 году и до его расторжения заказчиком было фактически выплачено 327 979 867,54. Были случаи подачи заказчиков на компанию ООО «БИОРГ» в суд. В 2020 году Управление ЗАГС Воронежской области выступило истцом с исковым заявлением к ООО «БИОРГ» (ИНН 7725682434) о неисполнении или ненадлежащем исполнении обязательств по договорам возмездного оказания услуг. Иск был удовлетворен только в августе 2022 года. Как сказано в материалах дела по договору услуги по оцифровке выполнялись путем двойного операторского ввода независимым друг от друга физическими лицами. Во время судебного разбирательства в ноябре 2021 года ООО «Биорг» было переименовано в ООО «Новые Технологии». С марта 2022 года эта организация находится в стадии банкротства. Учредителем обоих БИОРГОВ является Георгий Зуев. Для части проектов компания привлекала субподрядчиков. При этом в 2021 и 2022 новых контрактов с ЗАГСами у компании не было. Налицо зависимость компании не от массового спроса, и даже не госзаказа, а от госзаказов именно с ЗАГСами.

Вторая причина заключается в том, что в отличие от поставщиков ПО, часть выручки сервиса распознавания уходит удаленным операторам, корректирующим неправильную работу автоматики. А для того, чтобы сервис работал их количество должно быть велико, чтобы всегда были те, кто готовы выполнить задание. Сервис Биорга заявляет, что количество операторов составляет около 50 тыс. человек. А в 2021 году компанией было создано на волне пандемии 10 тыс. удаленных рабочих мест. Указанные цифры не выдерживают никакой критики, так как если в год каждый оператор зарабатывает хотя бы 10 000 руб, то общая выплата удаленным верификаторам составит 500 млн руб в год. При этом даже в этом случае говорить о серьезном социальном эффекте от проекта для такого количества операторов, конечно, нельзя. А даже такого среднего заработка на платформе исходя из показателей компании сейчас не видно. Можно добавить, что, если верить сообщениям сети, компания «Биорг» пыталась неудачно судиться с своими бывшими операторами за нелестные отзывы о себе на рекрутинговых сайтах.

Стоит добавить, что для развития сервиса основатель компании Георгий Зуев наделил топ-менеджеров долями в действующем ООО «БИОРГ» через механизм опциона, а сам планирует сосредоточиться на других технологических проектах. После сделки у него осталось 20% в проекте, а доли новых акционеров находятся под обременением.

Дибрейн

В 2021 и 2022 годах выручка компании ООО «Дибрейн» превышает 100 млн руб. При этом в 2022 году выручка упала на 15%, а прибыль упала на 60%.

-3

Кажется, в компании не отрицают участие операторов при распознавании текста, сами ее представители называют эту технологию human-in-the-loop. Правда, компания указывает, что разметчики данных включаются в работу только тогда, когда система действительно допускает оплошность. В качестве верификаторов для распознавания документов привлекаются исполнители платформы Яндекс Толока. Их количество неизвестно, по их отзывам на различных сайтах по тематике трудоустройства, заработок составляет 300-400 долларов (почему-то считают они именно в долларах, хотя в РФ законодательно запрещена оплата труда в иностранной валюте) в месяц. Но тут важно, что у самой Толоки на сайте указан копирайт «Intertech Services AG», а в пользовательском соглашении на русском языке в п. 10.4 указывается корпорация «Интертех Сервисиз АГ.», учрежденная и осуществляющая свою деятельность в соответствии с законодательством Швейцарии. Использование чужих верификаторов с одной стороны может избавлять компанию Dbrain от проблем, которые есть у сервиса Биорг с большим количеством «своих» верификаторов, но, с другой стороны, это делает ее технологически уязвимой, если иностранный владелец или куратор Толоки примет решение уйти из России. Цифры Dbrain выглядят куда более привлекательней чем у компании Биорг. Прямых госконтрактов у компании нет. Может быть, это как раз и связано с использованием услуг верификаторов на принадлежащей иностранной компании платформе. Хотя должность «руководитель направления по развитию бизнеса в государственном секторе» в Dbrain по состоянию на январь 2023 уже была.

Перед тем, как перейти непосредственно к показателям бизнеса, стоит отметить странный, но возможно важный для дальнейшего анализа факт. На сайте Dbrain указан копирайт зарегистрированной на Кипре компании «AVX COLLECTION LTD». При этом в Сколково и в документах «Политика конфиденциальности» и «Пользовательское соглашение» указывается именно ООО «Дибрейн», которое напрямую никак не связано с «AVX COLLECTION LTD». Так как 100% ООО «Дибрейн» принадлежит генеральному директору Алексею Хахунову.

Странности продолжаются при попытке сопоставить данные по выручке, прибыли и численности сотрудников. Выручка и прибыль растут до 2021 года, а численность уменьшается с 8 человек в 2019 году до 3 в 2021 году. При этом на сайте компании сейчас в разделе «О нас» выложены фотографии 25 человек, а в публикации от 18 января 2022 года в блоге Dbrain на сайте vc.ru на фотографии команды есть 19 человек. Это никак не соотносится с цифрами из государственного сервиса статистики. В 2022 году численность компании уже 9 человек. Важно также отметить, что на сайте компании в качестве CEO (аналог должности генерального директора) указан Дмитрий Мацкевич, а у Алексея Хахунова указана должность CTO (аналог технического директора). Дмитрий Мацкевич на публичных мероприятиях также заявляется как основатель и инвестор Dbrain, хотя формально к ООО «Дибрейн» с момента основания компании он, как видно, не имеет и не имел никакого отношения ни как учредитель ни как генеральный директор.

Учитывая все эти странности с юрлицами, основателями и численностью сотрудников проводить конструктивный анализ финансовых показателей, который мог бы показать инвестору текущее положение компании в России нам не представляется возможным. Так прибыль ООО «Дибрейн» в 2020 году при расчете на одного сотрудника составила в 2,8 млн руб, в 2021 получилось 28,3 млн руб на сотрудника, а в 2022 году – 3.8 млн руб. По выручке ситуация аналогичная.

К этому стоить добавить риски для работы в России, связанные с участием в технологическом процессе работы сервиса распознавания Dbrain верификаторов Яндекса, зарегистрированных на принадлежащей иностранцам краудсорсинговой платформе. Дополнительный риск для бизнеса Dbrain заключается в том, что Яндекс развивает свои облачные решения по распознаванию текста, что может привести к конкуренции и к конфликту интересов.

Выводы

Сочетание работы в сервисах распознавания документов нейросетей и верификаторов своей или чужой краудсорсинговой платформы, не позволяет понять, где автоматически работает ИИ, а где ввод клиентских данных просто передан на аутсорсинг. С точки зрения бизнеса ключевым аспектом работы этих сервисов является выбор платформы для верификации и стоимость аутсорсинга. Возвращаясь к истории с Mechanical Turk, мы видим, что игра в шахматы сегодня — это нейросети в системе искусственного интеллекта, а роль механических турков выполняют операторы сервиса распознавания документов. Только теперь их не нужно прятать в конструкцию, они легко «помещаются» в облако, чтобы незаметно удаленно выполнять свою работу.

Иван Дмитриев