Каким образом можно увеличить количество разрабатываемых в банке моделей с 10 до 100 в год, увеличив при этом личную эффективность дата-сайентистов, рассказывает Сергей Афанасьев, вице-президент, начальник управления статистического анализа банка Ренессанс Кредит.
— Что можно посоветовать среднему банку, активно работающему, например, в ипотечном сегменте и задумавшемуся о внедрении инновационных технологий риск-менеджмента? Нанять CIO, CDO? Заказать консалтинг? Или переделать штатного программиста под новые реалии?
С. Афанасьев: Лучшим способом разобраться с этой действительно важной для банков проблемой будет изучение практического опыта AI-трансформации коллег. Поделюсь таким кейсом.
Поступил запрос: протестировать новые популярные алгоритмы моделирования, такие как бустинг и нейросети, для задач скоринга и коллекшна, а также ускорить процесс разработки и внедрения моделей. Был разработан комплексный план AI-трансформации, включающий в себя несколько важных активностей.
1. Мы отказались от негибкого проприетарного аналитического софта и перевели разработку моделей на Python. Написали собственную Python-библиотеку, которая позволила автоматизировать большую часть ручной аналитики, а также (в сочетании с единым feature store) унифицировать и масштабировать процесс разработки моделей.
2. Параллельно провели ревью последних научных исследований по скоринговым моделям. Переосмыслили некоторые устаревшие техники и подходы, которые были актуальны для регрессионных методов. Уже через месяц стало очевидно, от чего можно отказаться, а что взять на вооружение.
3. Все сотрудники из старой скоринговой команды прошли ML-курсы и изучили Python. По отдельным направлениям, таким как NLP-моделирование и Deep Learning, им пришлось изучить массу специальной литературы. Для обмена опытом мы проводили межбанковские воркшопы, посещали конференции и тестировали почерпнутые идеи на собственных задачах.
Полный переход на Python-моделирование занял полгода. Причём на этом этапе не пришлось нанимать новых сотрудников, а расширение штата производилось по мере появления новых направлений моделирования.
— Каковы наиболее значимые показатели по итогам проекта, доказывающие его успешность?
С. Афанасьев: До перехода на Python мы разрабатывали и внедряли в среднем 10–12 моделей в год. Через два года количество моделей выросло до 100 в год. Кроме того...
Продолжение читайте на https://futurebanking.ru/post/4008