數據分析--檢測異常樣本方法

在建模或數據分析前,首先要做的事情就是數據預處理,數據預處理的好壞,很大程度上決定了模型或分析結果的好壞。其中,異常值(outliers)檢測是整個數據預處理過程中,十分重要的一環。方法也是多種多樣。 1、經驗法,對行業數據比較瞭解情況數據分析師,能很快發現數據的問題,經常能發現一些數據異常,如果沒有經驗通過算法也不一定能發現。這也是有經驗和沒有經驗的重要差別。     a)總體檢測,總規模、均值
相關文章
相關標籤/搜索