(信貸風控八)行爲評分卡模型(B卡)的介紹

 

原文連接 https://blog.csdn.net/LuYi_WeiLin/article/details/87907948性能

(八)行爲評分卡模型(B卡)的介紹
在信貸業務中,評分卡分爲三種:學習

申請評分卡(A卡)
行爲評分卡(B卡)
催收評分卡(C卡)
本篇咱們來學習一下行爲評分卡(B卡),首先什麼是行爲評分卡呢,行爲評分卡的使用場景以及目的,適用的信貸產品?測試

 

 

其中特別注意一下,不適合先息後本的信貸產品,由於每月的違約機率不同,很差預測.net

 

觀察期和表現期
學習行爲評分卡以前,要了解一些概念,什麼是觀察期和表現期,什麼是觀察點blog

 

 

觀察期觀察的是行爲,表現期預測表現好壞產品

P(表現期好壞/觀察期行爲)ast

這裏要注意一下,假如咱們定義表現壞客戶爲M3+,觀察期時間窗口爲12個月,則起碼要收集12+3個月的數據變量

 

固然觀察點也不宜太長,由於不到MOB的客戶,不能進入行爲評分卡中,會丟失大量重要數據數據

當此刻的時間知足了MOB可是不知足觀察期,也能夠構建B卡,可是有一些變量表現效果不怎麼好(由於和每一個變量的收集間隔有關,間隔長的變量收集得太少,表現天然不佳)時間

 

講完了觀察期和表現期,咱們就來說一下信用評分卡經常使用的特徵構造,特徵構造以前咱們來學習一個定義:時間切片

時間切片


特徵構造
通常有如下幾類特徵

還款率類型的特徵

 


額度使用率類型的特徵

 


逾期類型的特徵
這裏注意一下,不能用輕度逾期去預測輕度逾期,不能用重度逾期去預測重度逾期,這裏的目標變量是DPD(day past due)90,變量能夠是DPD60、DPD30等

 

消費類型的特徵(每一筆消費有具體詳細能夠作)


三方機構(社交數據、出行數據)
 

下面就來說解一下行爲評分卡創建模型的步驟(和申請評分卡差很少)

數據預處理
特徵衍生


特徵處理與篩選

 

 

 


變量分箱
模型的參數估計(邏輯迴歸模型)


特徵挑選
邏輯迴歸要求係數爲負並且P值要顯著,咱們使用外生模型GBDT估計模型重要性

 

 

也就是挑選4個GBDT模型最重要的變量進行邏輯迴歸後,發現其邏輯迴歸係數爲負,以後咱們按照GBDT模型變量重要性降序順序一個一個往裏面加,每加一個,進行一次邏輯迴歸,發現存在邏輯迴歸係數爲正的,就能夠把該變量剔除

 

添加完全部變量後,邏輯迴歸結果以下圖所示,仍是存在P值不顯著狀況,單獨拿去這些變量一個一個與目標變量進行邏輯迴歸檢驗其顯著性

 

因此,咱們使用LASSO再次進行變量挑選

 

模型的性能測試

機率轉換爲分數

相關文章
相關標籤/搜索