數據分析實戰之數據清洗

在數據分析過程當中不管是時間仍是功夫,數據清洗大概佔到了80%。函數 1、數據質量的準則:「徹底合一」3d 1)完整性:單條字段是否存在空值,統計的字段是否完善excel 2)全面性:觀察某一列的所有數值,根據常識判斷該列是否有問題,好比:數據定義、單位標識、數值自己。code 3)合法性:數據的類型、內容、大小的合法性orm 4)惟一性:數據是否存在重複記錄,行、列的數據都須要是惟一的blog
相關文章
相關標籤/搜索