python信用評分卡建模(附代碼,博主錄製)
https://blog.csdn.net/LuYi_WeiLin/article/details/88624268轉載微信
組合評分卡模型
本篇文章主要總結如下內容網絡
- 組合模型的概念
- 常見結構的評分組合模型
- 單一模型選擇須要什麼條件
- 串行結構組合模型實例
- 並行結構組合模型實例
組合模型的概念
常見結構的評分組合模型
- 串行結構組合模型實例
須要注意的是,通常工做中會把GBDT、神經網絡、深度學習排在前面(由於精度高),邏輯迴歸、決策樹放在後面學習
並行結構組合模型實編碼
混合結構組合模型實例(不易於解釋,通常不在評分卡使用)spa
單一模型選擇須要什麼條件
爲何單一模型之間要保證錯誤率的相互獨立?.net
由於組合模型基於原理就是錯誤率相對獨立,多個單一模型組合會使得組合模型錯誤率趨於0,也就是以下圖;假如單一模型之間都徹底不獨立的話,單一模型和組合模型預測同樣3d
爲何單一模型的複雜度要適度?htm
由於咱們知道組合模型的複雜度會大於單一模型的複雜度的,假如單一模型就很複雜了,組合模型的複雜度可想而知blog
其次,複雜度高通常就很難提升精度了,再想從組合模型提升精度,模型會愈來愈複雜
爲何單一模型不是越多越好?
由於在徹底獨立的狀況下,隨着單一模型數量的增多,組合模型的錯誤率下降的速率已經沒有那麼明顯了,並且隨着單一模型的增長,成本會增長。單一模型數量增長複雜度也會上升,響應時間會加長,在實際工做線上好比反欺詐模型要求時效性高要求毫秒級響應,因此數量並不是越多越好。
根據模型的構成維度能夠分爲:並行組合、串行組合
根據單一分類器類型能夠分爲:同態組合、異態組合
因此就會有四種類型的組合模型模式
串行結構組合模型實例
- 同態串行組合(通常不使用,同態串行組合錯誤率相互獨立性弱,沒有太大的提高效果)
- 異態串行組合
精度高的模型排在前面
以多層神經網絡和邏輯迴歸異態串行組合評分模型爲例
神經網絡模型不必定須要WOE編碼,可是神經網絡模型要求是數值型輸入,咱們也能夠採用其餘編碼
單一邏輯迴歸與多層神經網絡加邏輯迴歸得出的KS與AUC對比
我這裏異態串行組合提高不明顯的緣由是神經網絡沒有通過一個仔細的調參以及輸入節點太少
圖中融合器針對分類問題,能夠
圖中融合器針對迴歸問題,能夠
異態並行組合
爲何轉換爲log odds?方便分數的直接運算,由於分數的表達式以下,分數和分數就能夠直接加權平均了
同態並行組合
Boosting
RSM
python風控建模實戰lendingClub(博主錄製,catboost,lightgbm建模,2K超清分辨率)
https://study.163.com/course/courseMain.htm?courseId=1005988013&share=2&shareId=400000000398149
微信掃二維碼,免費學習更多python資源