[論文筆記] Methodologies for Data Quality Assessment and Improvement (ACM Comput.Surv, 2009) (2)

本篇博文主要對DMQ(S3.7)的分類進行了研讀。數據庫

1. 這個章節提出了一種DQM的分類法(以下圖)3d

image

由上圖可見,該分類法的分類標準是對assessment & improvement階段的支持,以及是否解決technique(quality dimensions) & economic方面的問題。orm

2. 從歷史發展的角度來看,數據質量維度的關注點與ICT(Information & Communication Technology)的發展是相關的。
(1) 五六十年代時,monolithic系統(一般只包含單個數據庫和單個主機),DQ主要關注accuracy, consistency, completeness, time-related dimensions. 數據質量管理面臨的最主要問題是:error localization, correction in data sources, record linkage between new data sources and pre-existing data bases.
(2) network-based階段. DMQ開始關注新的質量維度:compeleteness of the data source, currency of data, consistency of new data sources compared to the enterprise database.
(3) 隨着Web的出現,DMQ須要解決新的質量維度:accessibility, reputation

3. audit methodologies比complete、operational methodologies在assessmetn階段都要更準確。

4.  四種分類的簡介blog

  • audit methodologies: 主要是關於assessment階段
  • operational methodologeis: 關注點在於評估階段識別issues以便在改進階段取得好的效果。主要貢獻:(1) 一組相關維度的識別,以便改進; (2) 描述了一些改進這些維度的易懂的方法
  • completeness methodologies: 適用於大型DQ項目
  • economic methodologies: 做爲其餘DQM的補充
相關文章
相關標籤/搜索