分類器評估方法:準確率和混淆矩陣

注:本文是人工智能研究網的學習筆記機器學習

準確率

accuracy_score:函數計算分類準確率,返回被正確分類的樣本比例(default)或者是數量(normalize=False)函數

在多標籤分類問題中,該函數返回子集的準確率,對於一個給定的多標籤樣本,若是預測獲得的標籤集合與該樣本真正的標籤集合嚴格吻合,則subset accuracy =1.0不然是0.0性能

混淆矩陣

在機器學習中尤爲是統計分類中,混淆矩陣(confusion matrix),也被稱爲錯誤矩陣(error matrix)。學習

矩陣的每一列表達了分類器對於樣本的類別預測,二矩陣的每一行則表達了版本所屬的真實類別人工智能

之因此叫作’混淆矩陣‘,是由於可以很容易的看到機器學習有沒有將樣本的類別給混淆了。orm

Table of confusion
在預測分析中(predictive analytics)中table of confusion有時也叫(confusion matrix)是一個兩行兩列的表,這個表報告了四個預測相關的事件發生的數量: false positive, False negative, true positve和false negative。這個表能夠讓咱們更加詳細的分析預測系統的性能,熱不是僅僅用一個準確率。blog

Accuracy是一個不可靠的分類器性能度量標準,由於當數據集中不一樣類的別的樣本數量分佈不平衡的時候,它將會產生誤導人的結果。事件

好比說,若是數據集中有95個貓和5個狗,分類器會簡單的將其分爲貓,這樣的準確率是95%。get

最終的table of confusion是把全部的table of confusion平均組合起來的結果。it

相關文章
相關標籤/搜索