在機器學習中如何應對不均衡分類問題?

在處理機器學習等數據科學問題時,經常會碰到不均衡種類分佈的情況,即在樣本數據中一個或多個種類的觀察值明顯少於其他種類的觀察值的現象。在我們更關心少數類的問題時這個現象會非常突出,例如竊電問題、銀行詐騙性交易、罕見病鑑定等。在這種情況下,運用常規的機器學習算法的預測模型可能會無法準確預測。這是因爲機器學習算法通常是通過減少錯誤來增加準確性,而不考慮種類的平衡。這篇文章講了不同的方法來解決這個不均衡分
相關文章
相關標籤/搜索