如何在不平衡類上使用機器學習?

什麼也不做。有時好運就這樣降臨在你的頭上:你什麼都不需要做。你可以使用所謂的自然(或分層)分佈來進行訓練,有時不需任何修改就能正常運行。 通過某些方法使得數據更加平衡: 對少數類進行過採樣 對多數類進行欠採樣 合成新的少數類 捨棄所有少數類,切換成一個異常檢測框架。 在算法層面之上(或之後): 調整類的權重(錯誤分類成本) 調整決策閾值 使已有的算法對少數類更加敏感 構造一個在不平衡數據上表現更好
相關文章
相關標籤/搜索