不平衡數據的數據處理方法(F值)

 在機器學習中,不平衡數據是常見場景。不平衡數據一般指正樣本數量遠遠小於負樣本數量。如果數據不平衡,那麼分類器總是預測比例較大的類別,就能使得準確率達到很高的水平。比如正樣本的比例爲 1%,負樣本的比例爲 99%。這時候分類器不需要經過訓練,直接預測所有樣本爲負樣本,準確率能夠達到 99%。經過訓練的分類器反而可能沒有辦法達到99%。       對於不平衡數據的分類,爲了解決上述準確率失真的問題
相關文章
相關標籤/搜索