模型區分度衡量指標-KS值

1.KS值--學習器將正例和反例分開的能力,肯定最好的「截斷點」

KS曲線和ROC曲線都用到了TPR,FPR。KS曲線是把TPR和FPR都做爲縱座標,而樣本數做爲橫座標。可是AUC只評價了模型的總體訓練效果,並無指出如何劃分類別讓預估的效果達到最好。
不一樣之處在於,ks取的是TPR和FPR差值的最大值。
僞陽性率(FPR) :斷定爲正例卻不是真正例的比率
真陽性率(TPR) :斷定爲正例也是真正例的比率
僞陰性率(FNR) :斷定爲負例卻不是真負例的比率
真陰性率(TNR) :斷定爲負例也是真負例的比率學習

2.畫圖注意

令橫軸爲閾值,縱軸爲TPR和TPR,值域均爲[0, 1]。能夠這樣直觀理解,隨着橫座標從0到1變化,TPR越快提高,模型效果越好;反之,FPR越快提高,模型效果就越差。 ks值,正是圖中的最大差值,此時的橫軸取值,即是最佳閾值。 spa

3.做圖步驟

1. 根據學習器的預測結果(注意,是正例的機率值,非0/1變量)對樣本進行排序(從大到小)-----這就是截斷點依次選取的順序
2. 按順序選取截斷點,並計算TPR和FPR ---也能夠只選取n個截斷點,分別在1/n,2/n,3/n等位置
3. 橫軸爲樣本的佔比百分比(最大100%),縱軸分別爲TPR和FPR,能夠獲得KS曲線
4. TPR和FPR曲線分隔最開的位置就是最好的」截斷點「,最大間隔距離就是KS值,一般>0.2便可認爲模型有比較好偶的預測準確性
blog

相關文章
相關標籤/搜索