使用過採樣或欠採樣處理類別不均衡的數據後,如何正確的做交叉驗證?

使用過採樣或欠採樣處理類別不均衡的數據後,如何正確的做交叉驗證? 當我們遇到數據不均衡的時候,我們該如何做: 忽略這個問題 對佔比較大的類別進行欠採樣 對佔比較小的類別進行過採樣 忽略這個問題 如果我們使用不均衡的數據來訓練分類器,那麼訓練出來的分類器在預測數據的時候總會返回數據集中佔比最大的數據所對應的類別作爲結果。分類器的偏差太大,召回率爲零或非常接近零,而真假率爲1或非常接近於1,即所有或幾
相關文章
相關標籤/搜索