Найти тему
FutureBanking

Эволюция моделей в кредитном скоринге, или Зачем нужны нейронные сети в этой консервативной области?

Как при помощи нейронных сетей значительно улучшить метрики в кредитном скоринге без потери стабильности, в какую сумму обойдётся железо для их внедрения и какие новые направления открываются при удачном запуске проекта? Об этом — в статье Евгения Смирнова, руководителя Лаборатории машинного обучения Альфа-Банка.

29 сентября Евгений Смирнов примет участие в Scoring Day 2022. В рамках сессии о скоринге в период суперкороткого горизонта планирования он расскажет, как победить смещение распределения в задаче нейросетевого кредитного скоринга. Программа форума

Задача 1: убеждаем бизнес в необходимости развития моделей в кредитном скоринге с использованием нейросетей

В кредитных рисках банка был выстроен процесс оценки финансового эффекта за счёт улучшения моделей кредитного скоринга. Повышение разделяющей способности моделей позволяет при неизменном уровне риска одобрять большее количество заявок, что транслируется в увеличение числа выдач кредитных продуктов. Оценить общий эффект очень просто: необходимо умножить количество дополнительных выдач на LTV от выдачи кредитного продукта.

Как любая коммерческая компания, наш банк нацелен на увеличение чистой прибыли. Использование нейронных сетей увеличило качество PD-моделей на 6 п.п. Джини, что означало значимый финансовый эффект для бизнеса. Более того, в моделировании ранее уже был осуществлен переход с линейных моделей на градиентный бустинг.

Результат: портфельная команда поддержала использование нового подхода моделирования благодаря стабильности ожидаемого эффекта.

Задача 2: обеспечиваем стабильность работы решения

В первую очередь стабильность достигается на этапе разработки модели. Разработчик бьёт выборку по времени на две части — dev и oot. Далее dev-выборка разбивается случайным образом на train и valid в соотношении 9 к 1.

На этапе обучения и подбора гиперпараметров контролируется переобучение за счёт сравнения метрик качества на train и valid.

Наиболее стабильные модели получаются при минимальном различии метрик Джини на этих двух выборках. Затем нейронная сеть...

Продолжение читайте на https://futurebanking.ru/post/4006