初學者需要掌握的幾種基本的數據預處理方法

前言 在拿到一份數據準備做挖掘建模之前,首先需要進行初步的數據探索性分析(可以參考這篇:你願意花十分鐘系統瞭解數據分析方法嗎?),對數據探索性分析之後要先進行一系列的數據預處理步驟。因爲拿到的原始數據存在不完整、不一致、有異常的數據,而這些「錯誤」數據會嚴重影響到數據挖掘建模的執行效率甚至導致挖掘結果出現偏差,因此首先要數據清洗。數據清洗完成之後接着進行或者同時進行數據集成、轉換、歸一化等一系列處
相關文章
相關標籤/搜索