過採樣中用到的SMOTE算法

 平時很多分類問題都會面對樣本不均衡的問題,很多算法在這種情況下分類效果都不夠理想。類不平衡(class-imbalance)是指在訓練分類器中所使用的訓練集的類別分佈不均。比如說一個二分類問題,1000個訓練樣本,比較理想的情況是正類、負類樣本的數量相差不多;而如果正類樣本有995個、負類樣本僅5個,就意味着存在類不平衡。把樣本數量過少的類別稱爲「少數類」。         SMOTE算法的思想
相關文章
相關標籤/搜索