數據的清洗

時間 2021-08-15

原文原文鏈接

數據清洗一是爲了解決數據質量問題，二是讓數據更加適合做挖掘一、解決數據質量問題數據的完整性，比如人的屬性中缺少性別、籍貫、年齡等數據的唯一性，比如不同來源的數據出現重複的情況數據的權威性，比如同一個指標出現多個來源的數據，且數值不一樣數據的合法性，比如數據與常識不符，市區內開車速度到達了400km/h 數據的一致性，比如不同來源的不同指標，實際的內涵與表示意義是一樣的數據清洗的結果是對

>>阅读原文<<

相關文章

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<