自從學習數據倉庫以來,對數據倉庫「面向主題」的概念始終比較模糊,理解不夠深入、透徹。 昨天晚上翻開課本溫習一下,仍然不能領悟其本質思想、非常困惑,後來從網上找了一些資料,細細着磨一下。css
1.主題的概念數據庫
主題(Subject)是在較高層次上將企業信息系統中的數據進行綜合、歸類和分析利用的一個抽象概念,每個主題基本對應一個宏觀的分析領域。在邏輯意義上,它是對應企業中某一宏觀分析領域所涉及的分析對象。例如「銷售分析」就是一個分析領域,所以這個數據倉庫應用的主題就是「銷售分析」。學習
面向主題的數據組織方式,就是在較高層次上對分析對象數據的一個完整而且一致的描述,能刻畫各個分析對象所涉及的企業各項數據,以及數據之間的聯繫。所謂較高層次是相對面嚮應用的數據組織方式而言的,是指按照主題進行數據組織的方式具備更高的數據抽象級別。與傳統數據庫面向應用進行數據組織的特色相對應,數據倉庫中的數據是面向主題進行組織的。例如,一個生產企業的數據倉庫所組織的主題可能有產品定貨分析和貨物發運分析等。而按應用來組織則可能爲財務子系統、銷售子系統、供應子系統、人力資源子系統和生產調度子系統。spa
主題是根據分析的要求來肯定的。這與按照數據處理或應用的要求來組織數據是不一樣的。如在生產企業中,一樣是材料供應,在操做型數據庫系統中,人們所關心的是怎樣更方便和更快捷地進行材料供應的業務處理;而在進行分析處理時,人們就應該關心材料的不一樣採購渠道和材料供應是否及時,以及材料質量情況等。設計
數據倉庫面向在數據模型中已經定義好的公司的主要主題領域。典型的主題領域包括顧客、產品、訂單和財務或是其餘某項事務或活動。對象
2.主題域的獲取blog
主題域是對某個主題進行分析後肯定的主題的邊界。分析主題域,肯定要裝載到數據倉庫的主題是信息打包技術的第一步。而在進行數據倉庫設計時,通常是一次先創建一個主題或企業所有主題中的一部分,所以在大多數數據倉庫的設計過程當中都有一個主題域的選擇過程。主題域的肯定必須由最終用戶和數據倉庫的設計人員共同完成。事務
好比,對於Adventure Works Cycle這種類型的公司管理層須要分析的主題通常包括供應商主題、商品主題、客戶主題和倉庫主題。其中商品主題的內容包括記錄超市商品的採購狀況、商品的銷售狀況和商品的存儲狀況;客戶主題包括的內容可能有客戶購買商品的狀況;倉庫主題包括倉庫中商品的存儲狀況和倉庫的管理狀況等,如圖3-31所示。ci
圖3-31 根據業務狀況肯定的分析主題資源
肯定主題邊界實際上須要進一步理解業務關係,所以在肯定整個分析主題後,還須要對這些主題進行初步的細化才便於獲取每個主題應該具備的邊界。對於圖3-31的4個主題及其在企業中的業務關係能夠肯定邊界如圖3-32所示。
圖3-32 主題域的劃分
3.肯定主題的內容
主題雖然在信息包圖中只佔據標題的位置,可是倒是信息打包方法中最重要的部分,當主題定義好以後,數據倉庫中的邏輯模型也就基本成形了。此時,須要在主題的邏輯關係模式中包含全部的屬性及與系統相關的行爲。數據倉庫中的數據存儲結構也須要在邏輯模型的設計階段完成定義,須要向裏面增長所須要的信息和能充分表明主題的屬性組。以Adventure Works Cycle這類公司數據倉庫爲例,如表3-7所示能夠分別在「商品」、「銷售」和「客戶」主題上增長可以進一步說明主題的屬性組。
表3-7 主題的詳細描述
主 題 名 |
公 共 碼 鍵 |
屬 性 組 |
商品 |
商品號 |
商品固有信息:商品號,商品名,類型,顏色等 商品採購信息:商品號,供應商號,供應價,供應日期,供應量等 商品庫存信息:商品號,庫房號,庫存量,日期等 |
銷售 |
銷售單號 |
銷售單固有信息:銷售單號,銷售地址等 銷售信息:客戶號,商品號,銷售價,銷售量、銷售時間等 |
客戶 |
客戶號 |
客戶固有信息:客戶號,客戶名,性別,年齡,文化程度,住址,電話等 客戶經濟息:客戶號,年收入,家庭總收入等 |
4.主題的使用
因爲數據倉庫的設計是一個螺旋發展的過程,在剛開始,沒有必要在數據倉庫的數據庫中體現全部的主題,選擇最重要的主題做爲數據倉庫設計的試金石是頗有必要的。所以使用主題首先是找到須要分析的主題域。
例如在AdventureWorksDW數據倉庫的概念模型設計中,在對需求進行分析後,認識到「商品」主題既是一個銷售型企業最基本的業務對象,又是進行決策分析的最主要領域,於是把「銷售分析」主題域定義爲要首先創建的主題。經過「商品」主題的創建,經營者就能夠對整個企業的經營情況有較全面的瞭解。先實施「商品」主題能夠儘快地知足企業管理人員創建數據倉庫的最初要求,因此先選定「商品」主題進行實施。
經過將主題邊界的劃分應用到已經獲得的關係模型上還能造成原始的概念模型。這一模型是把主題域的劃分和事務處理數據庫中的表結合起來的模型,例如在上面的例子中,商品主題可能涵蓋的關係表有商品表、供應關係表、購買關係表和倉儲關係表;倉庫主題可能涵蓋的關係表有倉庫關係表、倉庫表、倉庫管理關係表和管理員表。把這些表的鍵和字段聯繫起來,就能夠造成如圖3-33所示的原始概念模型圖。
圖3-33 劃分了主題域的原始概念模型