◆版權聲明:本文出自胖喵~的博客,轉載必須註明出處。html
轉載請註明出處:http://www.cnblogs.com/by-dream/p/7668501.html 機器學習
前言學習
機器學習中通過聽到「召回率」和「精確率」 這兩個名詞,今天簡單解釋一下。spa
概念htm
首先我先簡單看幾個名詞解釋: blog
一般咱們預測的樣本中分爲正樣本和負樣本:ci
TP ( True Positive ):表示把正樣本預測爲正樣本;get
FP ( False Positive ):表示把負樣本預測爲正樣本;博客
TN ( True Negative ):表示把負樣本預測爲負樣本;it
FN ( False Negative ):表示把正樣本預測爲負樣本;
再理解概念應該比較容易了:
精確率(Precision):預測爲正的樣本中有多少是真正的正樣本。也就是
Precision = TP / ( TP + FP )
召回率(Recall):樣本中的正例有多少被預測正確了。也就是
Recall = TP / ( TP + FN )
這裏再提一個咱們平時經常使用的一個概念:準確率(accuracy) 即預測正確全部樣本佔總樣本的比例: (TP+TN)/(TP+FN+FP+TN)
維基百科中對召回率和精確率的解釋可能更加的直觀一些:
圖中的左側表明正樣本,右側表明負樣本,圈中的爲預測爲正樣本的數據。
在信息檢索領域,精確率和召回率又被稱爲查準率和查全率:
查準率=檢索出的相關信息量 / 檢索出的信息總量
查全率=檢索出的相關信息量 / 系統中的相關信息總量
舉例
假如讓你說出周杰倫《七里香》專輯裏的10首歌曲。
若是你一共只回答了3首,3首都是對的,那麼你的:
精確率 = TP / ( TP + FP ) = 3/(3+0) = 100%
召回率 = TP / ( TP + FN ) = 3/(3+7) = 30%
可見你雖然回答的精確率很是的高,可是你的召回率並不高,那麼可否能夠用召回率來衡量一我的的回答質量呢?咱們再看看下面的例子:
若是你一共回答了15首,其中10首是對的,5首是錯的,那麼你的:
精確率 = TP / ( TP + FP ) = 10/(10+5) = 66.6%
召回率 = TP / ( TP + FN ) = 10/(10+0) = 100%
可見你的召回率達到100%了,可是你的精確率卻並不高了。所以咱們在實際應用的過程當中,這兩個數值須要一塊兒用來評估。