不平衡學習(Imbalanced learning)

數據不平衡 在不少真實場景下,數據集每每是不平衡的。也就是說,在數據集中,有一類含有的數據要遠遠多於其餘類的數據(類別分佈不平衡)。在這裏,咱們主要介紹二分類中的類別不平衡問題,對於多類別的不平衡只作簡單的介紹。算法 考慮一個簡單的例子,假設咱們有一個關於醫院患者的數據集(裏面包含不少患者的圖片),咱們把其中患有癌症的病人標記爲正例,把健康的患者標記爲負例。衆所周知,健康的人的數量確定遠遠大於癌症
相關文章
相關標籤/搜索