機器學習-類別不平衡問題

一、類別不平衡          類別不平衡(class-imbalance)是指分類任務中不同類別的訓練樣例數目差別很大的情況。比如說一個二分類問題,1000個訓練樣本,比較理想的情況是正類、負類樣本的數量相差不多;而如果正類樣本有998個、負類樣本僅2個,就意味着存在類不平衡。那麼學習方法只需返回一個永遠將新樣本預測爲反例的學習器,就能達到99.8% 的精度;然而這樣的學習器往往沒有價值,因爲
相關文章
相關標籤/搜索