Найти тему
News 2035

Мультимодальное обучение, ИИ-инжиниринг и другие тренды в сфере машинного обучения и больших данных

Оглавление
Фото: Unsplash
Фото: Unsplash

Александр Бирюков, руководитель направления IT и разработки Центра компетенций НТИ по большим данным МГУ, назвал тренды в сфере данных и машинного обучения.

В частности, сейчас разработчики концентрируются на искусственном интеллекте, который будет генерировать информацию и предметы, в также на работе над более сильным ИИ для перехода в новую эпоху.

Обмен данными

В 2021 году у профильных специалистов и управленцев России окончательно сложилось ясное понимание о необходимости делиться данными. Собирается огромное количество данных, однако они остаются фрагментированными, «запертыми» внутри отдельных компаний или консорциумов. В условиях приоритизации развития инновационных решений и технологий, создания «умных городов», «умных» транспортных систем, «умной» медицины и других комплексных «умных» решений, становится очевидно, что необходимо налаживать и автоматизировать обмен данными во всех форматах: B2B, B2G, G2B, C2B. Это становится еще одной причиной такой популярности цифровых платформ, которую в том числе отметили в рамках дискуссии в АНО «Цифровая экономика».

Гиперавтоматизация как способ «сложного» использования данных

Все больше компаний склонны к «сложному» использованию данных. От автоматизации отдельных задач организации переходят к автоматизации целых бизнес-процессов, причем в рамках такой автоматизации используется гибкий data-driven подход к автоматизации. Например, осуществляется не просто мониторинг показателей с датчиков на производстве, а автоматизированное управление производством на основе обработки собираемых на производстве данных. На текущий момент это все еще непростая задача, так как она затрагивает вопросы информационной безопасности предприятия, однако пройдет не так много времени, прежде чем мы увидим широкое распространение полностью автоматизированных производств в совершенно разных отраслях.

ИИ-инжиниринг

Все более широкое распространение получают решения, позволяющие автоматизировать разработку цифровых продуктов на основе искусственного интеллекта (ИИ). Здесь затрагивается весь процесс создания решения: сбор, предобработка, разметка данных, разработка архитектуры ИИ, тестирование, оптимизация. Разработка простых ИИ-моделей становится доступна не только специалистам в области Data Science и Machine learning, но и отраслевым специалистам, не имеющим навыков программирования. Большую популярность получают решения AutoML — автоматизированной разработки моделей машинного обучения.

Генеративный ИИ

Генеративный ИИ — это ИИ, который способен создавать новую информацию или даже объекты в физическом мире (если у ИИ есть инструмент для творчества в нем) на основе «пройденного обучения». Большим событием в мире технологий стало появление модели по обработке естественного языка GPT-3, которая оказалась настолько мощной, что может сочинять пьесы, песни, поддерживать диалог с пользователем так, что он вряд ли поймет, что общается с машиной. При этом уже в ближайшие годы ожидается выход модели GPT-4, которая будет беспрецедентным по своему размеру и «силе» ИИ. Отечественные IT-компании также активно работают в данном направлении и достигают определенных успехов: например, Сбер в 2020 году презентовал модель RuGPT-3.

Мультимодальное обучение

Мультимодальное обучение – это обучение моделей сразу на нескольких источниках данных разных форматов, таких как текст, изображения, звук, видео и др. Такие модели «умеют» обобщать информацию, полученную из разных источников и форматов данных. Исследовательские коллективы уже продемонстрировали действенность такого подхода, показав на практике, что, когда модель обучается на мультимодальных данных, она может показывать результаты лучше, чем узкоспециализированные модели под конкретные задачи. Примером такой модели стала представленная командой DeepMind модель Gato, которая способна выполнять более 600 разнообразных задач, включая управление рукой-манипулятором, создание описания к изображениям, умение играть в некоторые игры и др. Примечательно, что в примерно в половине игр она показала результаты лучше чем человек, а в задаче управления рукой-манипулятором превзошла нейронную сеть, специально обученную для решения этой задачи.

«Сильный» ИИ через большие модели

Еще одним весомым трендом является создание «сильного» искусственного интеллекта — ИИ общего назначения, который сможет решать задачи из разных областей, дообучаться любым знаниям, доступным человеку. Такой ИИ станет основой для перехода к новой эпохе, в которой ИИ будет уметь как минимум все, что умеет человек, и будет способен продолжать обучаться дальше со скоростью, не доступной человеку. Однако сейчас можно говорить лишь о том, что специалисты «нащупали» вектор, в котором нужно работать для создания такого ИИ. На данный момент наиболее очевидный путь к сильному ИИ – увеличение размера моделей (количества их параметров) и использование мультимодального обучения. Подтверждением тому являются вышеупомянутые модели GPT-4 и Gato.

AI-native

Важной тенденцией, особенно в России, стал массовый переход к разработке цифровых решений в формате AI-native. В таких решениях сразу подразумевается наличие в том или ином виде ИИ или отдельных алгоритмов машинного обучения. Значительное влияние на этот переход в России, помимо общей мировой тенденции, на мой взгляд, оказали национальная программа «Цифровая экономика» и федеральный проект «Искусственный интеллект».

ИИ в кибербезопасности

В последнее время мы все чаще слышим о хакерских атаках. Специалисты кибербезопасности постоянно улучшают способы защиты информационных систем, а хакеры находят все новые уязвимости. Однако, до сих пор, наибольшей уязвимостью информационных систем является человеческий фактор. Хакеры используют простые инструменты социального инжиниринга, чтобы попасть в закрытые информационные контуры компаний, а «обиженные» сотрудники компаний «сливают» данные пользователей. На помощь приходит ИИ, который осуществляет мониторинг всех действий, осуществляемых в заданной информационной системе, и выявляет подозрительные действия и отклонения от нормального поведения отдельных пользователей, блокируя или ограничивая подозрительные действия до дальнейшего разбирательства специалистом.

Объяснимый ИИ

Все больше внимания специалиста уделяют также развитию объяснимого ИИ. В большинстве случаев ИИ воспринимается как черный ящик. Даже его разработчики не всегда знают точно, почему ИИ принимает те или иные решения в конкретных ситуациях, а многое узнается только эмпирически. Это вполне приемлемо в большинстве задач, однако мы не можем довериться черному ящику, если речь идет, например, о судьбе человека, будь то медицина или судебное разбирательство. В связи с этим важным трендом является развитие ИИ, решения которого мы могли бы понимать и при необходимости корректировать.

Обучение с подкреплением

Еще одно интересное направление машинного обучения – обучение с подкреплением. По сути, этот метод машинного обучения имитирует обучение человека в реальном мире. Машина помещается в определенную среду (например, робот в комнату с препятствиями), она не знает, какие «правила игры» в данной среде (не знает о гравитации, о том, как преодолевать препятствия и тд.), единственное что ей дается – это награда за приближение к своей цели (например к концу пути с препятствиями) и наказание за удаление от цели. Таким образом, машина путем множества попыток, эмпирически обучается достигать свою цель наиболее оптимальным способом. Ценность данного подхода в том, что нет необходимости заранее собирать огромные датасеты для предварительного обучения. Данный подход активно развивается и находит свое применение в решении множества задач.

Борьба с «предвзятостью» ИИ

Среди множества проблем, с которыми сталкиваются разработчики ИИ есть и этические. Данная проблема имеет достаточно большое освещение в мире, однако все еще практически не освещается в России. Она заключается в самой настоящей предвзятости моделей при принятии решений. Простейший пример – разработчик обучили ИИ для помощи рекрутеру в отборе персонала на исторических данных, собранных в этой компании. Однако как оказалось, модель распознала скрытые тенденции в принятии решения работодателем при отборе персонала и стала их повторять – при прочих равных она отдавала предпочтение молодым белым мужчинам, деприоритизируя женщин, темнокожих и «возрастных» кандидатов. В некотором смысле модель стала «черным зеркалом» общества. В то время как такие открытия являются хорошим напоминанием нам о существующих проблемах различных видов дискриминации, использовать такой ИИ на практике нельзя. В связи с этим, на всех мировых площадках сейчас обсуждаются различные подходы к борьбе с такой предвзятостью моделей.