關於評估標準的理解(樣本不平衡,準確率,召回率,ROC曲線等)

今天在分析數據的時候遇到一個樣本數據不平衡的問題,以前在學習機器學習的時候有學到樣本數據不平衡的原因和解決方法,不過因爲那時候並不在意,覺得數據多得是嘛,不平橫就隨機訓練和丟棄一些就好了,根本沒仔細考慮到數據量小的情況。 有時候數據量呈現8比2的比例,也就是正樣本與負樣本的數量比爲8:2,這時候在做機器學習就需要考慮如何合理的訓練與分配數據了,值得一提的是,樣本不平衡的情況十分常見。 不過樣本不平
相關文章
相關標籤/搜索