七招教你處理非平衡數據——避免得到一個「假」模型

原文鏈接:點擊打開鏈接       這篇博客主要介紹處理不平衡數據的技巧,那麼什麼是不平衡數據呢?比如說一位醫生做了一個病例對照研究,數據集由病例10人和對照990人組成,建立好一個邏輯迴歸模型後,並對建立的模型進行內部驗證,居然發現其正確率高達99%,然後把他興奮壞了,覺得可以將該成果發表到頂級期刊上,從此走上人生巔峯。然而,我們可以發現,該模型不管怎麼預測,都能得到正常的結果,所謂的99%的正
相關文章
相關標籤/搜索