113 подписчиков

Три кита успешного внедрения Data Science

13 июня 202413 июн 2024

2 мин

Евгений Смирнов, руководитель лаборатории машинного обучения Альфа-Банка, генеральный продюсер форума Data Day`24, разбирает ключевые аспекты успешного внедрения Data Science в бизнес-процессы компании.

Распространение генеративного ИИ всё больше стимулирует компании принимать решения на основе данных, делать компанию поистине data driven и стремиться к покрытию всех бизнес-процессов моделями машинного обучения. Спрос рождает предложение — и появляется всё больше предложений по «внедрению ИИ». При этом отличить хайп от действительно полезной и финансово эффективной инициативы довольно сложно. Особенно если это ваш первый подобный проект, на который вас вдохновили рассказы о том, что «ИИ может всё».

Кроме того, внедрение более простых решений, как показывает эмпирический опыт, не всегда заканчивается успехом.

Зачем же вообще нужен Data Science, каких ошибок нужно избежать и на чём концентрировать внимание?

Зачем нужен Data Science в бизнес-процессах компании?

Приоритетная цель деятельности любой коммерческой компании — постоянное повышение уровня счастья акционеров и клиентов, и достигнуть её можно только путём постоянного улучшения бизнес-процессов. Используя инструменты Data Science (DS) для принятия решений на основе данных, бизнес получает три ключевых бенефита:

<...>

Целесообразность внедрения

К проекту по Data Science следует относиться так же, как и ко всем остальным, значит, без оценки эффективности не обойтись. Сначала стоит оценить техническую целесообразность решения, потом — экономическую.

На техническую эффективность решения влияют ML System Design и настройка всех этапов жизненного цикла модели — от постановки задачи до мониторинга качества модели.

В нашей области часто пытаются решать задачу самым сложным способом. Я вижу три причины этого:

— термин «наука о данных» стимулирует многих экспертов ориентироваться на статьи, посвящённые SOTA-методам для решения задач;

— дата-саентисты любят участвовать в соревнованиях, в которых первые места занимают решения с ансамблями из SOTA-решений;

— более сложные методы чаще оказываются на слуху по сравнению с простыми, и по этой причине их гораздо проще продать ~~обывателям~~ бизнесу.

Когда на хайпе были нейронки, мою команду нередко просили разработать специальную нейронную сеть для решения задачи поиска подстроки в строке. Хотя для её решения нет нужды в ML — можно ограничиться регулярными выражениями...

Продолжение читайте на https://futurebanking.ru/post/4072

4 июля на форуме Data Day ведущие аналитики, рисковики и Data Scientist из Тинькофф, Wildberries, Сбера, Ozon, Райффайзенбанка, МТС и др. расскажут о новейших возможностях работы с данными и их монетизации и обсудят успешные стратегии и кейсы внедрения Data Science. Сайт и программа форума