三招提升數據不平衡模型的性能(附python代碼)

 對於深度學習而言,數據集非常重要,但在實際項目中,或多或少會碰見數據不平衡問題。什麼是數據不平衡呢?舉例來說,現在有一個任務是判斷西瓜是否成熟,這是一個二分類問題——西瓜是生的還是熟的,該任務的數據集由兩部分數據組成,成熟西瓜與生西瓜,假設生西瓜的樣本數量遠遠大於成熟西瓜樣本的數量,針對這樣的數據集訓練出來的算法「偏向」於識別新樣本爲生西瓜,存心讓你買不到甜的西瓜以解夏天之苦,這就是一個數據不平
相關文章
相關標籤/搜索