數據挖掘:數據預處理——異常值處理

離羣點處理 一、離羣點是什麼? 離羣點,是一個數據對象,它顯著不同於其他數據對象,與其他數據分佈有較爲顯著的不同。有時也稱非離羣點爲「正常數據」,離羣點爲「異常數據」。 離羣點跟噪聲數據不一樣,噪聲是被觀測變量的隨機誤差或方差。一般而言,噪聲在數據分析(包括離羣點分析)中不是令人感興趣的,需要在數據預處理中剔除的,減少對後續模型預估的影響,增加精度。 離羣點檢測是有意義的,因爲懷疑產生它們的分佈不
相關文章
相關標籤/搜索