預測值 | |||
正例 | 負例 | ||
真實值 | 正例 | 真正例(A) | 假負例(B) |
負例 | 假正例(C) | 真負例(D) |
預測值 | |||
正例 | 負例 | ||
真實值 | 正例 | TP | FN |
負例 | FP | TN |
模型測試通常用四個指標來衡量:測試
準確率(Accuracy): 提取出的正確樣本數/總樣本數spa
召回率(Recall):正確的正例樣本數/樣本中的正例樣本數,也定義爲查全率3d
精準率(Precision):正確的正例樣本數/預測爲正例的樣本數,也定義爲查準率blog
F值:等於召回率和精準率的調和平均值ci
這裏須要注意的是召回率和精準率的關係是互斥的,其緣由爲:io
1.對於召回率而言,其分母是固定的,是真實值中正例的數目,咱們但願召回率(即查全率)是越高越好的,其極限條件就是當全部值都認定爲是正例時,召回率就爲1,可是這樣作的缺點是沒法區分正例和負例,好比,正例爲患病人數,負例爲健康人數,若是召回率爲1,即認爲測試樣本中的全部人都是有病的,顯然這樣作是不合理的;table
2.若是咱們但願召回率增長,即測值中的正例數是增長的,以下表:(其中正例表示患病,負例表示健康,目的是在找出樣本中的患病人數)im
狀況1call
預測值 | |||
正例:70 | 負例:30 | ||
真實值 | 正例:80 | TP:60 | FN:20 |
負例:20 | FP:10 | TN:10 |
召回率:3/4(查全率)d3
精準率:6/7(查準率)
狀況2
預測值 | |||
正例:75 | 負例:25 | ||
真實值 | 正例:80 | TP:64 | FN:10 |
負例:20 | FP:11 | TN:15 |
召回率:64/80
精準率:64/75
3.由上面的分析可得,因爲真正例和假正例的比例是不變的,當預測值中正例樣本數增長時,真正例和假正例的值都會增長,可是分子對於分母差了一個假正例的數值,因此在此狀況下,召回率是增長的,即查全率增長,可是差準率相應下降。
簡單理解就是,認爲多數人是患病的,那麼查全的機率是增長的,可是都多數人結果會形成查準的下降。