不平衡學習(Imbalanced learning)

數據不平衡 在很多真實場景下,數據集往往是不平衡的。也就是說,在數據集中,有一類含有的數據要遠遠多於其他類的數據(類別分佈不平衡)。在這裏,我們主要介紹二分類中的類別不平衡問題,對於多類別的不平衡只做簡單的介紹。 考慮一個簡單的例子,假設我們有一個關於醫院患者的數據集(裏面包含很多患者的圖片),我們把其中患有癌症的病人標記爲正例,把健康的患者標記爲負例。衆所周知,健康的人的數量肯定遠遠大於癌症患者
相關文章
相關標籤/搜索