類別不平衡問題 —— 各種評估指標

 類別不平衡問題 在二分類問題中,通常假設正負類別相對均衡(混淆矩陣),然而實際應用中類別不平衡的問題,如100, 1000, 10000倍的數據偏斜是非常常見的,比如疾病檢測中未患病的人數遠超患病的人數,產品質量檢測中合格產品數量遠超不合格產品等。在檢測信用卡欺詐問題中,同樣正例的數目稀少,而且正例的數量會隨着時間和地點的改變而不斷變化,分類器要想在不斷變化的正負樣本中達到好的檢測效果是非常困難
相關文章
相關標籤/搜索