詳解大數據清洗工具

在進行數據分析和可視化之前,經常需要先「清洗」數據。這意味着什麼?可能有些詞條列表裏是「New York City」,而其他人寫成「New York, NY」。然而,你在看到某些模式前得將各種各樣的輸入詞彙標準化。又或者,出現一些數值輸入錯誤,錯別字什麼的。 有很多工具都可以實現你想要的功能,但大多都是付費的。對於專業人士來說,這些成本是值得的,但對於時不時才使用的業餘人士來說,未免有些浪費。下面
相關文章
相關標籤/搜索