數據清洗及OpenRefine工具

數據分析中,首先要進行數據清洗,纔可以繼續訓練模型,預測等操作。   首先介紹一下什麼是數據清洗   數據清洗從名字上也看的出就是把「髒」的「洗掉」,指發現並糾正數據文件中可識別的錯誤的最後一道程序,包括檢查數據一致性,處理無效值和缺失值等。我們要按照一定的規則把「髒數據」「洗掉」,這就是數據清洗。而數據清洗的任務是過濾那些不符合要求的數據,過濾。不符合要求的數據主要是有不完整的數據、錯誤的數據、
相關文章
相關標籤/搜索