不均衡數據處理方法學習筆記

實際生產數據中會出現大量不均衡數據,若是直接對原始數據進行模型訓練會使結果失真,達不到預期 不均衡數據處理方法主要有三種:算法 一.欠採樣:經常使用的是隨機採樣 缺陷:將多數類樣本刪除有可能會致使分類器丟失有關多數類的重要信息學習 二.過採樣:1.簡單複製少數類樣本,2.擴大數據集 缺陷:可能會致使分類器學習出現過擬合現象大數據 三.SMOTE過採樣:利用特徵空間中現存少數類樣本之間的類似性來創建
相關文章
相關標籤/搜索