Евгений Смирнов, руководитель лаборатории машинного обучения Альфа-Банка, генеральный продюсер форума Data Day`24, разбирает ключевые аспекты успешного внедрения Data Science в бизнес-процессы компании.
Распространение генеративного ИИ всё больше стимулирует компании принимать решения на основе данных, делать компанию поистине data driven и стремиться к покрытию всех бизнес-процессов моделями машинного обучения. Спрос рождает предложение — и появляется всё больше предложений по «внедрению ИИ». При этом отличить хайп от действительно полезной и финансово эффективной инициативы довольно сложно. Особенно если это ваш первый подобный проект, на который вас вдохновили рассказы о том, что «ИИ может всё».
Кроме того, внедрение более простых решений, как показывает эмпирический опыт, не всегда заканчивается успехом.
Зачем же вообще нужен Data Science, каких ошибок нужно избежать и на чём концентрировать внимание?
Зачем нужен Data Science в бизнес-процессах компании?
Приоритетная цель деятельности любой коммерческой компании — постоянное повышение уровня счастья акционеров и клиентов, и достигнуть её можно только путём постоянного улучшения бизнес-процессов. Используя инструменты Data Science (DS) для принятия решений на основе данных, бизнес получает три ключевых бенефита:
<...>
Целесообразность внедрения
К проекту по Data Science следует относиться так же, как и ко всем остальным, значит, без оценки эффективности не обойтись. Сначала стоит оценить техническую целесообразность решения, потом — экономическую.
На техническую эффективность решения влияют ML System Design и настройка всех этапов жизненного цикла модели — от постановки задачи до мониторинга качества модели.
В нашей области часто пытаются решать задачу самым сложным способом. Я вижу три причины этого:
— термин «наука о данных» стимулирует многих экспертов ориентироваться на статьи, посвящённые SOTA-методам для решения задач;
— дата-саентисты любят участвовать в соревнованиях, в которых первые места занимают решения с ансамблями из SOTA-решений;
— более сложные методы чаще оказываются на слуху по сравнению с простыми, и по этой причине их гораздо проще продать обывателям бизнесу.
Когда на хайпе были нейронки, мою команду нередко просили разработать специальную нейронную сеть для решения задачи поиска подстроки в строке. Хотя для её решения нет нужды в ML — можно ограничиться регулярными выражениями...
Продолжение читайте на https://futurebanking.ru/post/4072
4 июля на форуме Data Day ведущие аналитики, рисковики и Data Scientist из Тинькофф, Wildberries, Сбера, Ozon, Райффайзенбанка, МТС и др. расскажут о новейших возможностях работы с данными и их монетизации и обсудят успешные стратегии и кейсы внедрения Data Science. Сайт и программа форума