機器學習︱非平衡數據處理方式與評估

解決這一問題的基本思路是讓正負樣本在訓練過程中擁有相同的話語權,比如利用採樣與加權等方法。爲了方便起見,我們把數據集中樣本較多的那一類稱爲「大衆類」,樣本較少的那一類稱爲「小衆類」。 解決方式分爲: . 一、相關方法總結 1、採樣 採樣方法是通過對訓練集進行處理使其從不平衡的數據集變成平衡的數據集,在大部分情況下會對最終的結果帶來提升。 採樣分爲上採樣(Oversampling,過採樣)和下采樣(
相關文章
相關標籤/搜索