數據探索之數據質量分析

數據質量分析的主要任務是檢查原始數據中是否存在髒數據,髒數據一般指的是不符合要求,以及不能直接進行相應分析的數據。數據的質量分析側重於髒數據的發現,而數據清洗則是對這些髒數據的修正或者丟棄。一般情況下,數據的質量分析與數據清洗是相伴而行的,在分析出髒數據的時候伴隨着數據的清洗。 常見的髒數據包括如下: 1.缺失值 缺失值產生的一般由如下原因造成: (1) 有些信息無法獲取; (2) 有些信息出現遺
相關文章
相關標籤/搜索