如何做好數據預處理(二)

在上一篇文章中我們提到的數據預處理的數據清洗,數據清洗就是對於骯髒數據的清除,而骯髒數據主要有異常值和缺失值,我們在進行數據預處理的時候不但要注意數據的清洗,還需要注意數據的集成、數據變換、數據規範的內容,只有這樣,我們才能夠爲下一步工作做好鋪墊。 首先說說數據集成吧,所謂數據集成就是將多個數據源合併放到一個數據存儲中,當然如果所分析的數據原本就在一個數據存儲裏就不需要數據的集成了。一般來說,數據
相關文章
相關標籤/搜索