解決分類樣本不平衡問題

樣本不平衡會致使出現如下的問題: (1)少數類所包含的信息頗有限,難以肯定少數類數據的分佈,即難以在內部挖掘規律,形成少數類的識別率低; (2)不少分類算法採用分治法,樣本空間的逐漸劃分會致使數據碎片問題,這樣只能在各個獨立的子空間中尋找數據的規律,對於少數類來講每一個子空間中包含了不多的數據信息,一些跨空間的數據規律就不能被挖掘出來。 (3)不恰當的概括偏置系統在存在不肯定時每每傾向於把樣本分類
相關文章
相關標籤/搜索