爲什麼ROC曲線不受樣本不均衡問題的影響

在對分類模型的評價標準中,除了常用的錯誤率,精確率,召回率和F1度量外,還有兩類曲線:ROC曲線和PR曲線,它們都是基於混淆矩陣,在不同分類閾值下兩個重要量的關係曲線。 在二分類問題中,分類器將一個實例分類爲正樣本和負樣本,全部分類樣本可以用一個混淆矩陣來表示。混淆矩陣有四個分類,如下表: 對於PR曲線,它是精確率(precision,簡稱P)和召回率(Recall,簡稱R)的關係曲線,計算式如下
相關文章
相關標籤/搜索