樣本不均衡問題

在分類問題中,經常會遇到訓練數據類別不均衡的情況。比如在安防監測問題中,絕大部分的樣本均爲正常人羣,可用的壞人樣本相當稀少。如果拿全量樣本去訓練一個簡單的高準確率的二分類模型,那結果毫無疑問會嚴重偏向於正常人羣,從而導致模型的失效。 本文從改善採樣方式、模型和評價指標等角度出發,來介紹適用於各種場景下的解決樣本不均衡問題的方法。 一、 採樣 採樣的目的就是使得各類樣本均衡。這裏稱數據充分的類爲豐富
相關文章
相關標籤/搜索