數據倉庫基本概念

###數據倉庫 4個特徵:數據庫

  • 面向主題 :數據倉庫側重於數據分析工做,是按照主題存儲的
  • 集成的 :對原有分散的數據庫通過加工,彙總和整理獲得,消除數據的不一致性,保證數據倉庫內的信息是整個企業的一致的全局信息
  • 相對穩定的 :有大量的查詢操做,修改和刪除操做不多
  • 反映歷史變化的 :系統記錄過去某一時間點到目前各階段的信息

存儲的數據:數據分析

  • 元數據:數據字典,數據的定義,數據的抽取規則等
  • 數據: 按照元數據的定義格則,通過抽取,清理,轉換,集成,按照主題從新組織,依照相應的存儲結構進行存儲

數據集市

        數據集市能夠看作是數據倉庫的一個子集,它含有較少的主題,數據量更少;它通常是爲了知足企業特定部門的分析需求而專門創建的數據的集合,所以也稱爲部門級數據倉庫,數據來源是數據倉庫io

###緩慢變化維         Slowly Changing Dimensions(SCD),維度的屬性不是靜態的,會隨着時間變化發生緩慢的變化。
        處理緩慢變化維一般有三種方式:class

  • 直接覆蓋原值
    優勢:容易實現 缺點:沒有保留歷史數據
  • 添加維度行 維度屬性發生變化時,生成一條新的維度記錄,經過天然健與原維度記錄保持關聯。
  • 添加屬性列
    添加屬性列,來記錄該屬性變化前的值,而本屬性直接覆蓋。
    缺點:只保留了最後一次變化信息

###退化維度
        保存在事實表中,是事實表的一個屬性,可是不須要對應的維度表。im

相關文章
相關標籤/搜索