西瓜書3.3擴展softmax迴歸及3.6類別不平衡問題

一:類別不平衡問題,通俗來講就是正負樣本分佈不平衡,假如,正樣本較少,負樣本較多。 對於一般的線性迴歸問題,預測值y>0.5時判爲正例。 解決類別不平衡的問題的三種解決辦法: ①對負樣本進行欠採樣,即去除一些負樣本,使正負樣本分佈均衡。主要的代表算法是EasyEnsemble.將負樣本劃分爲不同的集合供不同的學習器使用,這樣保證了欠採樣不缺失重要的信息。 ②對正樣本進行過採樣。主要的算法是SMOT
相關文章
相關標籤/搜索