數據預處理(1)——數據清洗

一、介紹     數據清洗主要內容是刪除原始數據集中的無關數據、重複數據,平滑噪聲數據,刷選掉與挖掘主題無關的數據,處理缺失值、異常值等。 二、缺失值處理     缺失值處理的方法分爲三類:刪除記錄、數據插補和不處理。常見的數據插補方法如下圖: 其中,需要介紹的兩個插值法爲:拉格朗日插值法和牛頓插值法。 2.1 拉格朗日插值法 2.2 牛頓插值法 3、關於拉格朗日插值法的示例 #拉格朗日插值代碼
相關文章
相關標籤/搜索