機器學習之模型評價指標

  預測值
正例 負例
真實值 正例  真正例(A)  假負例(B)
負例  假正例(C)  真負例(D)

 

  預測值
正例 負例
真實值 正例  TP  FN
負例  FP TN

模型測試通常用四個指標來衡量:測試

準確率(Accuracy): 提取出的正確樣本數/總樣本數spa

召回率(Recall):正確的正例樣本數/樣本中的正例樣本數,也定義爲查全率3d

精準率(Precision):正確的正例樣本數/預測爲正例的樣本數,也定義爲查準率blog

F值:等於召回率和精準率的調和平均值ci

這裏須要注意的是召回率和精準率的關係是互斥的,其緣由爲:io

1.對於召回率而言,其分母是固定的,是真實值中正例的數目,咱們但願召回率(即查全率)是越高越好的,其極限條件就是當全部值都認定爲是正例時,召回率就爲1,可是這樣作的缺點是沒法區分正例和負例,好比,正例爲患病人數,負例爲健康人數,若是召回率爲1,即認爲測試樣本中的全部人都是有病的,顯然這樣作是不合理的;table

2.若是咱們但願召回率增長,即測值中的正例數是增長的,以下表:(其中正例表示患病,負例表示健康,目的是在找出樣本中的患病人數)im

狀況1call

  預測值
正例:70 負例:30
真實值 正例:80  TP:60  FN:20
負例:20  FP:10 TN:10

召回率:3/4(查全率)d3

精準率:6/7(查準率)

狀況2

  預測值
正例:75 負例:25
真實值 正例:80  TP:64  FN:10
負例:20  FP:11 TN:15

 召回率:64/80

精準率:64/75

3.由上面的分析可得,因爲真正例和假正例的比例是不變的,當預測值中正例樣本數增長時,真正例和假正例的值都會增長,可是分子對於分母差了一個假正例的數值,因此在此狀況下,召回率是增長的,即查全率增長,可是差準率相應下降。

簡單理解就是,認爲多數人是患病的,那麼查全的機率是增長的,可是都多數人結果會形成查準的下降。

相關文章
相關標籤/搜索