處理不均衡數據(Dealing with imbalanced data)簡潔版

(1)想辦法獲取更多的數據。 前段時期的數據,較多呈現紅色部分的數據較少呈現藍色部分的數據;後半時期,產生數據的趨勢發生變化,較多呈現藍色部分數據較少呈現紅色部分數據。所以,想辦法獲取更多的數據。 (2)換個評判方式 通常我們會用精度(Accuracy)和錯誤率(error)來評價模型的好壞。這兩個指標在數據不均衡時,均不能客觀的衡量模型。 解決辦法: 通過Confusion Matrix,計算查
相關文章
相關標籤/搜索