6個策略處理不平衡數據

數據不平衡問題被認爲是數據挖掘和機器學習領域的主要問題之一,因爲大多數機器學習算法假設數據是均勻分佈的。 在數據不平衡的情況下,多數類主導少數類,機器學習分類器會更偏向於多數類。 這導致少數羣體的分類不良,分類器甚至可以將所有測試數據預測爲多數類。 在這篇文章當中你可以獲得7種處理不平衡數據的方法。   什麼是不平衡數據? 不平衡數據通常是指分類問題的問題,其中類沒有被平等地表示。 不平衡數據集的
相關文章
相關標籤/搜索