數據挖掘學習------------------1-數據準備-3-數據預處理

1.3、數據預處理 (1.數據清洗 數據清洗是通過填寫缺失的值,光滑噪聲數據,識別或刪除離羣點,並解決不一致性等方式來‘清洗’數據的。 主要任務:填充缺失值和去除噪聲 1、缺失值處理 注意:缺失值並不意味着數據有錯誤。例如:申請信用卡時,可能要求申請人提供駕駛執照號,但他沒有,允許他寫「不適用」、空、等值。但後來他考過了,又來更新。所以說空值是被允許的,但是需要將這樣的空值適當的進行處理或轉化。
相關文章
相關標籤/搜索