BAUM AI — российская компания, которая производит классические и распределенные системы хранения данных и разрабатывает Интеграционную платформу искусственного интеллекта «ГосИИ».
В материале - о том, какие задачи решает BAUM AI для российских компаний.
Помогают создавать ИИ без навыков кодирования
BAUM AI появилась на рынке в 2012 году на базе МГТУ им. Н.Э. Баумана, альма-матер создателей компании и разработчиков алгоритма обработки данных. Директор компании — ученый, доктор технических наук, профессор МГТУ им. Н. Э. Баумана и эксперт РАН Владимир Нелюб.
Команда разрабатывает системы хранения данных разных видов, как традиционные, так и распределенные. Для эффективного управления системами хранения появилась идея создавать платформы искусственного интеллекта. Позже она переросла в тот продукт, который есть сейчас, а именно в Интеграционную платформу искусственного интеллекта «ГосИИ». Это платформа, которая интегрирует готовые решения и позволяет создавать решения в области искусственного интеллекта без глубоких профессиональных знаний. Она работает в режимах low-code — малого кодирования и drag-and-drop — свободного перемещения блоков.
Суть low-code в том, что для проведения анализа человеку не нужно глубоко погружаться в знания в области искусственного интеллекта или учить специальные языки программирования вроде Python. То есть он создает готовое решение, не программируя, а собирая из дропов — готовых блоков.
Весь путь проходит в специальном графическом интерфейсе. Допустим, у клиента есть задача провести классификацию клиентов в банке. Он заходит в систему и выстраивает пайплайн — цепочку логически связанных блоков. Система подсказывает, как правильно сделать и какие источники данных выбрать. Пользователи выстраивают то, что хотят получить, обучают систему и получают запрашиваемый результат. Предполагается, что все это работает на сертифицированной системе хранения данных на отечественной компонентной базе.
Уже сейчас на платформе реализован функционал по обработке числовых данных как на основе существующих фреймворков, таких как TensorFlow — это открытая программная библиотека для машинного обучения от Google, которая включает поддержку программирования глубоких нейронных сетей и методов машинного обучения, так и на основе авторских алгоритмов, моделей и методов. Все это позволяет эффективно и безопасно проводить анализ данных.
Разработчики предоставляют не только свою платформу, но и услуги по анализу данных. Это могут быть коробочные решения на предприятиях, например отдельные системы хранения с искусственным интеллектом.
Серверы BAUM AI прошли лицензирование и имеют сертификаты, что позволяет применять их не только на предприятиях малого бизнеса, но и на крупных, в том числе в федеральных органах исполнительной власти. Крупнейший заказчик — это ФНС. С ним компания работает в рамках закрытого контура — это значит, что все процессы проходят на стороне ФНС: и обработка, и хранение данных.
Экосистема BAUM AI
Единый сервис — интеграционная платформа, которая позволяет объединить не только клиентов, но и разработчиков различных подсистем, моделей, методов искусственного интеллекта, в частности, разработчиков из экосистемы Центров искусственного интеллекта, которые были созданы в 2021 году по решению Правительства РФ. Благодаря интеграции с «ГосИИ» эти центры обогатят платформу технологиями и готовыми решениями.
В экосистеме BAUM AI много ИТ-компаний и вузов, которые также активно заняты разработкой модулей и систем искусственного интеллекта. Задача BAUM AI в первую очередь объединять их и предоставлять рынок сбыта своих продуктов.
К 2024 году компания планирует выйти на рынок ЕАЭС. А в прошлом году BAUM AI представила разработку экономических моделей до 2027 года. По результатам оценки финансовых результатов проект показал себя как инвестиционно привлекательный, так как за пять лет индекс рентабельности инвестиций превышает 250%. Срок окупаемости — менее трех лет, дальше только в плюс.
К 2027 году BAUM AI планирует занять более 10% рынка России и ЕАЭС с готовым продуктом «ГосИИ».
Определяют фейковые компании
Пример задачи для ФНС, которую решила команда, — определение фейковых юрлиц на этапе регистрации. Когда кто-то регистрирует ООО, разработчики могут определить вероятностью более 90%, существует эта компания в реальности или нет. По этой задаче они завершили пилотный проект в Санкт-Петербурге.
Анализ аномалий производят методами машинного обучения с помощью большого количества критериев. Система получает данные, которые указывают при заполнении заявки на открытие компаний, и оценивает порядка 2000 параметров, на основе которых делает вывод.
В результате пилотного запуска в Петербурге точность выявления фейковых организаций составила около 92%. Создатели системы начали разбираться, почему система ошибалась на 8%, и детальнее изучили эти компании. Оказалось, что из них 1,5–2 п.п. значатся, как реальные, но специалисты ФНС подтвердили, что они действительно фейковые, а значит, система дает точность 93,5–94%.
Методы: DBSCAN (плотностной алгоритм пространственной кластеризации с присутствием шума) — типичный алгоритм кластеризации на основе плотности, который может разделить область с достаточно высокой плотностью на кластеры и найти кластеры любой формы в зашумленной пространственной базе данных.
Предсказывают пожары
Экологический проект BAUM AI — система предиктивной аналитики и автоматического информирования о риске возникновения лесных пожаров в определенном регионе. Система позволит сократить время реагирования пожарных и МЧС. В процессе решения этой задачи команда разработала многокритериальный алгоритм машинного обучения и усовершенствовала ряд существующих алгоритмов. Полученный комплекс моделей позволяет достигать точности прогноза до 85%.
Разработчики получили систему моделей искусственного интеллекта, которые умеют анализировать так называемые термические точки при определении вероятности пожара.
Кроме вероятности пожара, важно определить класс горения и территории локализации возгорания. Здесь используются данные из открытых источников, которые обновляются три раза в сутки. Этого достаточно для подобного мониторинга. Это решение позволяет указывать координаты и площадь возгорания, чтобы организовать мониторинг местности и патрулирование в этих зонах. Еще разработчики добавили интерфейс для автоматизированного информирования ответственных лиц.
Методы: сбор данных и «склейка» в датасет, препроцессинг, извлечение геоданных, нейронные сети (Dense, LSTM, Conv1D), ML-алгоритмы SVM, Autoencoders.
Помогают распознавать сердечно-сосудистые заболевания…
Вместе с коллегами из Федерального медико-биологического агентства разработчики создали интеллектуальную систему, которая помогает ставить диагнозы сердечно-сосудистой системы в момент лабораторных испытаний и классифицировать их.
Эта разработка легла в основу виртуального медицинского ассистента для врача. Система позволяет сформировать цифровой профиль пациента, отслеживает важные показатели и информирует специалиста о состоянии пациента. Ассистент поддерживает принятие решения врача и повышает эффективность его работы, а также определяет зоны риска для пациента.
Методы и возможности системы: сбор данных по анализам с учетом дополнительных демографических данных, нейронная сеть и машинное обучение для постановки диагноза, отслеживание показателей анализов и формирование рекомендаций пациенту.
...и охранять объекты
Еще один интересный кейс — по охране и защите периметров объектов с ограниченным доступом.
В BAUM AI разработали систему интеллектуального анализа, которая позволяет определять нарушение защищаемого периметра. Причем если пробежит собака, то система определяет, что это собака. Если это злоумышленник, то, исходя из звуковых колебаний, их форм и вида, система позволяет определить, что это человек.
Специалисты МГТУ имени Баумана проработали решение совместно с МГТС в их телекоммуникационных колодцах. В качестве сервиса интеллектуального анализа предоставляли аналитику данных для защиты от воровства кабелей в телекоммуникационных колодцах.
Если кто-то снял крышку колодца и начал срезать кабели, то система определяет, что это не просто сверху проехала машина или дворник чистит снег, а действительно происходит воровство.
Вся информация передается тут же в автоматическом режиме на пульт, и команда выезжает, чтобы проверить коммуникации. Такое решение с применением виброакустических датчиков особенно актуально для протяженных трасс, где не получается поставить другие системы охраны на протяженных участках. Технология позволяет проводить мониторинг даже при подземной прокладке оптоволоконного кабеля на глубине до 20 см, например вдоль участков железной дороги.
Методы: RandomForestClassifier (классификатор случайного леса) — это метаоценка, которая соответствует ряду классификаторов дерева решений на различных подвыборках набора данных и использует усреднение для повышения точности прогнозирования и контроля избыточной подгонки.