SMOTE算法-樣本類別不平衡問題

類別不平衡問題 類別不平衡問題,顧名思義,即數據集中存在某一類樣本,其數量遠多於或遠少於其他類樣本,從而導致一些機器學習模型失效的問題。例如邏輯迴歸即不適合處理類別不平衡問題,例如邏輯迴歸在欺詐檢測問題中,因爲絕大多數樣本都爲正常樣本,欺詐樣本很少,邏輯迴歸算法會傾向於把大多數樣本判定爲正常樣本,這樣能達到很高的準確率,但是達不到很高的召回率。        上採樣(過採樣)和下采樣(負採樣)策略
相關文章
相關標籤/搜索