樣本不平衡 分類 難分樣本 hard example OHEM

樣本不平衡問題   如在二分類中正負樣本比例存在較大差距,導致模型的預測偏向某一類別。如果正樣本佔據1%,而負樣本佔據99%,那麼模型只需要對所有樣本輸出預測爲負樣本,那麼模型輕鬆可以達到99%的正確率。一般此時需使用其他度量標準來判斷模型性能。比如召回率ReCall(查全率:樣本中所有標記爲正樣本的有多少被模型預測爲正樣本)。 從數據層解決辦法:   1、欠採樣(undersampling):將
相關文章
相關標籤/搜索