機器學習之偏斜類誤差度量

機器學習分類模型存在一種情況叫偏斜類。偏斜類簡單理解就是在訓練模型時由於正樣本和負樣本之間的嚴重不平衡,導致模型最後檢測全部都是1或者全部都是0。假設正樣本的y值爲1,當正樣本遠遠多於負樣本的時候,訓練好的模型就會一直輸出1,這會給我們判斷模型優劣帶來一定的障礙,比如模型輸出1的概率是99.8%,輸出0的概率是0.2%,這裏我們就會認爲模型的精度很好,誤差很小。但是其實這種結果是由於數據集的不平衡
相關文章
相關標籤/搜索