面試之-1.0數據集類別分佈不平衡問題

數據分佈不平衡解決方法(ML版) (加粗部分,有知識擴充) 1.數據角度: 擴大數據集:最主要是添加小類別數據 採樣: 上採樣(增加小樣本數)和下采樣(減少大樣本數)–> 上採樣由於樣本會重複出現,容易出現過擬合;下采樣由於都是一部分數據導致模型只學習到一部分特徵 —> 針對上採樣問題:上採樣,在每次新生成的數據點時加入隨機擾動;下采樣:①(Easy Ensemble)多次下采樣(有放回),產生多
相關文章
相關標籤/搜索