Что делать, если качество внешних данных по-прежнему оставляет желать лучшего, а принятие ключевых решений на их основе может иметь далеко идущие последствия? Алексей Ерюков, управляющий директор Управления подготовки данных Департамента анализа данных и моделирования Газпромбанка, рассказывает о методе, который позволяет отслеживать отклонения в переменных и своевременно корректировать модель. — С какими проблемами вам приходится сталкиваться при использовании внешних данных?
А. Ерюков: Основная проблема — их интеграция во внутренние данные компании, для распознавания и объединения которых используются специальные идентификаторы, позволяющие определить, что речь идёт об одном и том же клиенте или заявке. Для внешних данных такого идентификатора нет. И хотя, например, для данных БКИ в качестве идентификатора используются ФИО, серия и номер паспорта и дата рождения, их совершенно недостаточно — на практике встречаются люди с одинаковыми ФИО и одинаковой датой рождения. 6