學習數據倉庫之設計

數據倉庫與數據庫的差異是什麼呢?各自的應用場景在哪裏呢?數據庫

在業務系統中使用的數據庫,其中通常存儲的是在線交易數據,是以業務單位組織數據並進行存儲的。因爲數據庫是面向具體的應用,如今通常採用關係模型的設計方法。經過關係模型以保證數據的原子性、一致性和完整性,消除數據冗餘,通常採用符合範式的規則來約束設計。設計

數據倉庫從設計之初就是爲了數據分析服務的,所以在數據組織上是以面向主題進行組織和存儲的。是經過在多個維度上對歷史數據進行觀察和分析,爲決策人員提供在該關注點(主題)上的輔助決策信息。所以在設計上也不一樣於數據庫的關係模型,而是採用多維分析數據模型。blog

數據倉庫是分析系統的數據平臺,它利用從事務系統獲取數據,並作彙總、加工,爲決策者提供決策的依據。事務

分析系統是過後的,它要提供關注時間段內全部的有效數據。這些數據是海量的,彙總計算起來也要慢一些,可是,只要可以提供有效的分析數據就達到目的了。數據分析

 

 數據倉庫有事實表和維度表。方法

事實表中通常存放的是和主題相關的度量(數值)數據以及爲了和維錶鏈接而創建的鍵字段,在維度表中存放的可能是維度描述信息和鍵字段。im

爲了更好地理解,咱們能夠看看這個例子:d3

對於有個商品的營銷業務進行分析,下面列出了咱們的分析的需求目標、分析的維度指標、維度的層次結構等,能夠更好的理解什麼是事實表,什麼是維度表。數據

 

 

 咱們的事實表存放的是商品的銷售記錄。維度表存放的是客戶的信息、商品的信息等。img

相關文章
相關標籤/搜索