不平衡數據研究

不平衡數據 不平衡數據的表現: 較少的正樣本數,並且具有最少實例數的類通常是學習任務的興趣類。 正負樣本交替重疊(如圖a) 小的不相連的樣本(如圖b) 不平衡數據的處理方法主要有: 數據層面:通過對數據進行預處理來減少類不平衡對於分類的影響——隨機過採樣、隨機欠採樣、綜合採樣 算法層面:通過設計新算法或改進已有算法來解決類不平衡問題 代價敏感學習:該方法介於數據層面和算法層面之間,它包含了數據層面
相關文章
相關標籤/搜索