機器學習過程中數據不平衡問題的處理方法

        這是我今天遇到的一個問題,也是機器學習中一個比較典型的問題,問題是這樣的,我拿到了一堆數據,數據一共有3020條,包含了10個類別,要求訓練一個分類器能夠準確識別各個分類。對於小數據規模的機器學習而言,與我們入門時,練手的鳶尾花數據集相比,至少在數據量上還是比較充足的。其實不然,如下表,是整個數據中,各個類別所佔的條數:  表1 各類別數據條數 class 1 class 2 cl
相關文章
相關標籤/搜索