不均衡學習

1、簡介            在不少場景的數據集中,都會出現某一類數據的數量遠遠多於其它類的數據,通常都是以二分類的類別不平衡問題爲主。一個簡單的理解,假如某個數據集,10萬個正樣本(正經常使用戶標籤爲0)與1000個負樣本(有問題用戶標籤爲1),正負樣本比例爲100:1,若是模型學習每一次梯度降低使用全量樣本,負樣本的權重不到1/100,即便徹底不學習負樣本的信息,準確率也有99%,因此實際應
相關文章
相關標籤/搜索