數據挖掘:數據處理-異常值處理

1,什麼是異常值?    異常值即是樣本數據中的離羣點,將那些明顯與其他樣本不同的數據視爲異常值。異常值雖然數量較少,但是對於模型(對異常值敏感的模型)的影響很大,所以必須對異常值進行處理。 2,異常值的來源    異常值的來源主要分爲人爲誤差和自然誤差,具體來說包括以下幾類:數據輸入錯誤、測量誤差、實驗誤差、故意異常值、數據處理錯誤、抽樣錯誤、自然異常值。總而言之,在數據處理的任何環節都有可能產
相關文章
相關標籤/搜索