處理不均衡的數據(imbalanced data)

什麼是不均衡數據  不均衡數據的形式很簡單. 這裏有蘋果和梨, 當你發現你手中的數據對你說, 幾乎全世界的人都只吃梨, 如果隨便抓一個路人甲, 讓你猜他吃蘋果還是梨, 正常人都會猜測梨. 不均衡的數據預測起來很簡單. 永遠都猜多的那一方面準沒錯. 特別是紅色多的那一方佔了90%. 只需要每一次預測的時候都猜紅色, 預測準確率就已經達到了相當高的90%了. 沒錯, 機器也懂這個小伎倆. 所以機器學到
相關文章
相關標籤/搜索