不平衡數據分類算法介紹與比較

介紹 在數據挖掘中,經常會存在不平衡數據的分類問題,比如在異常監控預測中,由於異常就大多數情況下都不會出現,因此想要達到良好的識別效果普通的分類算法還遠遠不夠,這裏介紹幾種處理不平衡數據的常用方法及對比。 符號表示 記多數類的樣本集合爲L,少數類的樣本集合爲S。 用r=|S|/|L|表示少數類與多數類的比例 基準 我們先用一個邏輯斯諦迴歸作爲該實驗的基準: Weighted loss functi
相關文章
相關標籤/搜索