Recall(召回率)and Precision(精確率)

  ◆版權聲明:本文出自胖喵~的博客,轉載必須註明出處。html

  轉載請註明出處:http://www.cnblogs.com/by-dream/p/7668501.html 機器學習

 

前言學習


  機器學習中通過聽到「召回率」和「精確率」 這兩個名詞,今天簡單解釋一下。spa

 

概念htm


  首先我先簡單看幾個名詞解釋:  blog

  一般咱們預測的樣本中分爲正樣本和負樣本:ci

    TP ( True Positive ):表示把正樣本預測爲正樣本get

    FP ( False Positive ):表示把負樣本預測爲正樣本博客

    TN ( True Negative ):表示把負樣本預測爲負樣本it

    FN ( False Negative ):表示把正樣本預測爲負樣本

 

  再理解概念應該比較容易了:

    精確率(Precision):預測爲正的樣本中有多少是真正的正樣本。也就是  

    Precision = TP / ( TP + FP )

    召回率(Recall):樣本中的正例有多少被預測正確了。也就是  

    Recall = TP / ( TP + FN )

  這裏再提一個咱們平時經常使用的一個概念:準確率(accuracy) 即預測正確全部樣本佔總樣本的比例: (TP+TN)/(TP+FN+FP+TN)

 

  維基百科中對召回率和精確率的解釋可能更加的直觀一些:

  圖中的左側表明正樣本,右側表明負樣本,圈中的爲預測爲正樣本的數據。

  在信息檢索領域,精確率和召回率又被稱爲查準率和查全率:

    查準率=檢索出的相關信息量 / 檢索出的信息總量
    查全率=檢索出的相關信息量 / 系統中的相關信息總量

 

舉例


  假如讓你說出周杰倫《七里香》專輯裏的10首歌曲。

  若是你一共只回答了3首,3首都是對的,那麼你的:
    精確率 = TP / ( TP + FP ) = 3/(3+0) = 100%
    召回率 = TP / ( TP + FN ) = 3/(3+7) = 30%

  可見你雖然回答的精確率很是的高,可是你的召回率並不高,那麼可否能夠用召回率來衡量一我的的回答質量呢?咱們再看看下面的例子:

  若是你一共回答了15首,其中10首是對的,5首是錯的,那麼你的:

    精確率 = TP / ( TP + FP ) = 10/(10+5) = 66.6%
    召回率 = TP / ( TP + FN ) = 10/(10+0) = 100%

  可見你的召回率達到100%了,可是你的精確率卻並不高了。所以咱們在實際應用的過程當中,這兩個數值須要一塊兒用來評估。 

相關文章
相關標籤/搜索