機器學習樣本不平衡如何處理?

問:在機器學習訓練時候,有時候會出現正負樣本極其不平衡的狀況,什麼狀況下會出現這種狀況?有何有效的方法避免此類問題? 答: 場景:在通常人羣中生病vs沒病;在通常工做狀態下故障vs無端障;在通常交易中正常vs欺詐,等。 解決方法: 一、收集更多或不一樣的數據。 二、生成合成的樣本。 三、數據重採樣。 四、將性能指標更改成混淆矩陣、精確性和召回率。F1得分,kappa,ROC曲線等。 五、採用內建非
相關文章
相關標籤/搜索