洛倫茲曲線(Lorenz curve)也叫提高圖或收益曲線python
提高圖主要經過隨機選擇比較模型表現。
綠色曲線比黃色曲線更加不平衡ide
基尼係數=A/(A+B)學習
A+B爲正方形一半恆定面積,A區間面積越大,基尼係數越大
Lift, Lift Table, and Lift Chart3d
提高指數、提高表和提高圖對象
I) Lift(提高指數)是評估一個預測模型是否有效的一個度量;這個比值由運用和不運用這個模型所得來的結果計算而來。blog
II) 一個簡單的數字例子:排序
i. 好比說你要向選定的1000人郵寄調查問卷。以往的經驗告訴你大概20%的人會把填好的問卷寄回給你,即1000人中有200人會對你的問卷做出迴應(response),用統計學的術語,咱們說baseline response rate是20%;ci
ii. 若是你如今就郵寄問卷,1000份你指望能收回200份,這可能達不到一次問卷調查所要求的回收率,好比說工做手冊規定郵寄問卷回收率要在25%以上;get
iii. 經過之前的問卷調查,你收集了關於問卷採訪對象的相關資料,好比說年齡、教育程度之類。利用這些數據,你肯定了哪類被訪問者對問卷反應積極。假設你已經利用這些過去的數據創建了模型,這個模型把這1000人分了類,如今你能夠從你的千人名單中挑選出反應最積極的100人來,這10%的人的反應率(response rate)爲60%。那麼,對這100人的羣體(咱們稱之爲Top 10%),經過運用咱們的模型,相對的提高(gain or lift value)就爲60%/20%=3;換句話說,與不運用模型而隨機選擇相比,運用模型而挑選有3倍的好處;數據分析
iv. 相似地,對佔總樣本的任何比例的人羣,咱們均可以計算出相應的提高指數,好比說咱們能夠計算Top 20%的羣體的提高指數。
III) 一個結論就是,提高指數越大,模型的運行效果越好。
I) 利用已經創建的評分模型,對咱們要驗證的樣本進行評分。樣本下的每個個體都將獲得一個分數,或者是違約機率,或者是一個分值;
II) 對樣本按照上面計算好的分數進行降序排序;
III) 把已經排好序的樣本依次分紅10個數量相同的羣體,咱們就創建了一個叫decile的變量,它依次取10個值,一、二、三、四、五、六、七、八、九、10,diclie1包括違約機率值較高的10%的個體,diclie2包括下一個10%的羣體,以此類推;
IV) 賬戶總數是每一個decile下的樣本數,它是整個樣本數的10%;
V) 邊際壞帳數是每一個decile內違約的人數,就是說,利用咱們的評分模型,在decile1,有25我的違約,以此類推;
VI) 累計壞帳數,45代表前兩個decile內共有45我的違約,以此類推;
VII) 邊際壞帳率是每一個decile內壞帳的比率。對decile1,邊際壞帳率由25/100得來;
VIII) 對每個加總的decile,都計算一個累計壞帳率,好比說,對前兩個decile,也就是整個樣本的20%,累計壞帳率等於(25+20)/(100+100);
IX) 在每一個decile裏,提高指數(Lift)就是相應的累計壞帳率與平均壞帳率的偏離程度,計算公式是(累計壞帳率-平均壞帳率)/平均壞帳率,習慣上還會乘上一個100。
X) 注:在一些處理中,提高指數直接由每一個decile的累計壞帳率除以平均壞帳率得來,它們之間就相差1,一個是相對偏離,一個是偏離。
XI) 就咱們考察的信用評分模型,它的目的就是儘量把人羣區別來開來,好比說「好」的顧客、 「壞」的顧客。提高指數越大,代表模型運做效果越好。
表1:Lift Table
歡迎各位同窗學習python金融風控評分卡模型和數據分析微專業課
https://edu.51cto.com/sd/f2e9b