異常值的處理

原理3西格瑪準則,對一組數據計算處理後,可以得到一個置信區間,在此區間之外的部分應該被視爲異常值。 3西格瑪:0.68-0.95-0.99。 處理方法:箱線圖 上下兩邊出現的點視爲異常值.Pandas中提供boxplot()方法繪製箱型圖 a)直接刪除 b) 使用前後兩個邊界值的均值替換 c) 不處理 d) 視爲缺失值,利用缺失值的處理方法修正 若要對異常值進行修改,使用 pandas.DataF
相關文章
相關標籤/搜索