正負樣本不均衡

樣本不均衡 類別不均衡是指在分類學習算法中,不同類別樣本的比例相差懸殊,它會對算法的學習過程造成重大的干擾。比如在一個二分類的問題上,有1000個樣本,其中5個正樣本,995個負樣本,在這種情況下,算法只需將所有的樣本預測爲負樣本,那麼它的精度也可以達到99.5%,雖然結果的精度很高,但它依然沒有價值,因爲這樣的學習算法不能預測出正樣本。這裏我們可以知道不均衡問題會導致樣本較少那一類的高錯分率,即
相關文章
相關標籤/搜索