11 數據清洗

時間 2021-01-17

標籤數據分析简体版

原文原文鏈接

在數據分析過程中，數據清洗在時間上佔到了80%。數據質量的準則（「完全合一」）（1）完整性：單條數據是否存在空值，統計的字段是否完善。（2）全面性：觀察某一列的全部數值，通過常識來判斷該列是否有問題。（3）合法性：數據的類型、內容、大小的合法性。（4）唯一性：數據是否存在重複記錄數據清理要使數據標準、趕緊、連續，爲後續數據統計、數據挖掘做好準備。 1、完整性問題1：缺失值解決辦法：

>>阅读原文<<

相關文章

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<