如何處理不平衡數據

採樣法 過採樣和欠採樣 過採樣:過擬合(學習到小類別樣本中的噪聲) 欠採樣:欠擬合(丟失大類別樣本中的重要數據) SMOTE算法 找到小類別樣本中的k個近鄰,然後在他們之間的連線上取點,作爲新的樣本。 缺點:容易過擬合 Borderline-SMOTE 其與SMOTE的不同是:SMOTE是對每一個minority樣本產生綜合新樣本,而Borderline-SMOTE僅對靠近邊界的minority樣
相關文章
相關標籤/搜索