數據倉庫ETL工具——清洗和規範化(二)

過濾器及其度量 在數據體系中,總會有一些數據看起來沒什麼問題,一旦聯繫了上下文或者和其它數據放在一起就會發現數據存在問題,我們稱這樣的數據爲異常數據。 在監測數據異常時,通常採用一下方式: 數據採樣:對有問題的列進行分組,計算該表的行數,可以使用數據評估工具 約束類型:把各種不同類型的數據質量檢查分爲四大類型     √ 列屬性約束:保證由源系統輸入的數據包含系統的期望值,列屬性約束檢查的過濾器包
相關文章
相關標籤/搜索