機器學習數據不均衡問題(轉載)

在機器學習任務中,我們經常會遇到這種困擾:數據不平衡問題。        數據不平衡問題主要存在於有監督機器學習任務中。當遇到不平衡數據時,以總體分類準確率爲學習目標的傳統分類算法會過多地關注多數類,從而使得少數類樣本的分類性能下降。絕大多數常見的機器學習算法對於不平衡數據集都不能很好地工作。        本文介紹幾種有效的解決數據不平衡情況下有效訓練有監督算法的思路: 1、重新採樣訓練集   
相關文章
相關標籤/搜索