developers.google.com/machine-lea…算法
咱們作出如下定義:優化
咱們可使用一個 2x2 混淆矩陣來總結咱們的「狼預測」模型,該矩陣描述了全部可能出現的結果(共四種): google
真正例是指模型將正類別樣本正確地預測爲正類別。一樣,真負例是指模型將負類別樣本正確地預測爲負類別。3d
假正例是指模型將負類別樣本錯誤地預測爲正類別,而假負例是指模型將正類別樣本錯誤地預測爲負類別。cdn
準確率是指咱們的模型預測正確的結果所佔的比例。正式點說,準確率的定義以下: blog
在被識別爲正類別的樣本中,確實爲正類別的比例是多少?排序
精確率的定義以下: get
在全部正類別樣本中,被正確識別爲正類別的比例是多少?數學
從數學上講,召回率的定義以下: it
反映了模型的穩健型
ROC 曲線(接收者操做特徵曲線)是一種顯示分類模型在全部分類閾值下的效果的圖表。該曲線繪製瞭如下兩個參數:
真正例率 (TPR) 是召回率的同義詞,所以定義以下:
ROC 曲線用於繪製採用不一樣分類閾值時的 TPR 與 FPR。下降分類閾值會致使將更多樣本歸爲正類別,從而增長假正例和真正例的個數。下圖顯示了一個典型的 ROC 曲線。
AUC (Area Under Curve) 被定義爲ROC曲線下的面積,顯然這個面積的數值不會大於1。又因爲ROC曲線通常都處於y=x這條直線的上方,因此AUC的取值範圍通常在0.5和1之間。使用AUC值做爲評價標準是由於不少時候ROC曲線並不能清晰的說明哪一個分類器的效果更好,而做爲一個數值,對應AUC更大的分類器效果更好。
曲線下面積表示「ROC 曲線下面積」。也就是說,曲線下面積測量的是從 (0,0) 到 (1,1) 之間整個 ROC 曲線如下的整個二維面積
不過,這兩個緣由都有各自的侷限性,這可能會致使曲線下面積在某些用例中不太實用:
並不是老是但願尺度不變。 例如,有時咱們很是須要被良好校準的機率輸出,而曲線下面積沒法告訴咱們這一結果。
並不是老是但願分類閾值不變。 在假負例與假正例的代價存在較大差別的狀況下,儘可能減小一種類型的分類錯誤可能相當重要。例如,在進行垃圾郵件檢測時,您可能但願優先考慮儘可能減小假正例(即便這會致使假負例大幅增長)。對於此類優化,曲線下面積並不是一個實用的指標。