大數據ETL實踐探索(8)---- 數據清洗的目的,方法

文章大綱 數據清洗的目的 解決數據質量問題 讓數據更適合做挖掘、展示、分析 數據清洗的步驟 第0步:數據導入及元數據處理 第一步:缺失值清洗 第二步:格式內容清洗 第三步:邏輯錯誤清洗 第四步:非需求數據清洗 第五步:關聯性驗證 一行代碼探索性數據分析 參考文獻 我們目前進入了一個大數據的時代。以我目前經常處理的醫療保健數據爲例。 隨着時間的推移醫療保健數據的生成速度越來越快,預計到2020年將達
相關文章
相關標籤/搜索