數據預處理之缺失值、異常值處理

缺失值的檢查與處理應該來說是比較簡單的,這篇先來說說異常值的檢查與處理 一、異常值的檢查 異常值的檢查,最初我都是作圖觀察,把那些明顯偏離了整體分佈情況的點劃歸爲異常點,這樣的做法也帶有比較強的主觀性。 這邊補充一些用來判斷異常值的統計學方法。 1、基於正態分佈的一元離羣點檢測方法 假設有 n 個點 ,那麼可以計算出這 n 個點的均值  和方差。均值和方差分別被定義爲:              
相關文章
相關標籤/搜索