數據庫與數據倉庫

 

decision support system (DSS) environments
數據庫

focussed on OLTP-type applications. For detailed information on DSS and mixed environments, see the Oracle Database Data Warehousing Guide.
架構

 

商業智能又名商務智能,英文爲Business Intelligence,簡寫爲BI。
商業智能的概念於1996年最先由加特納集團(Gartner Group)提出,加特納集團將商業智能定義爲:商業智能描述了一系列的概念和方法,經過應用基於事實的支持系統來輔助商業決策的制定。商業智能技術提供使企業迅速分析數據的技術和方法,包括收集、管理和分析數據,將這些數據轉化爲有用的信息,而後分發到企業各處。

商業智能一般被理解爲將企業中現有的數據轉化爲知識,幫助企業作出明智的業務經營決策的工具。這裏所談的數據包括來自企業業務系統的訂單、庫存、交易帳目、客戶和供應商等來自企業所處行業和競爭對手的數據以及來自企業所處的其餘外部環境中的各類數據。而商業智能可以輔助的業務經營決策,既能夠是操做層的,也能夠是戰術層和戰略層的決策。爲了將數據轉化爲知識,須要利用數據倉庫、聯機分析處理(OLAP)工具和數據挖掘等技術。所以,從技術層面上講,商業智能不是什麼新技術,它只是數據倉庫、OLAP和數據挖掘等技術的綜合運用。

商業智能的實現涉及到軟件、硬件、諮詢服務及應用,其基本體系結構包括數據倉庫、聯機分析處理和數據挖掘三個部分。

所以,把商業智能當作是一種解決方案應該比較恰當。商業智能的關鍵是從許多來自不一樣的企業運做系統的數據中提取出有用的數據並進行清理,以保證數據的正確性,而後通過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合併到一個企業級的數據倉庫裏,從而獲得企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變爲輔助決策的知識),最後將知識呈現給管理者,爲管理者的決策過程提供支持。

app

 

商業創建在信任之上。信任是一種披着情感外衣的互惠主義。在困境中作出正確決策的人和機構可以贏得自尊和他人的尊敬,這種感情上的東西是很是寶貴的,即使它不能爲數據所捕捉和反映。數據庫設計

目前這一歷史時期最大的創新就在於,咱們的生活如今由收集數據的計算機調控着。在這個時代,頭腦沒法理解的複雜狀況,數據能夠幫咱們解讀其中的含義。數據能夠彌補咱們對直覺的過度自信,數據能夠減輕慾望對知覺的扭曲程度。ide

 

 

 

關係理論致使關係數據庫
數據倉庫理論致使數據倉庫工具

任何一個實踐應用都有相應的理論做爲支撐

數據倉庫之父比爾·恩門(Bill Inmon)在1991年出版的「Building the Data Warehouse」(《創建數據倉庫》)一書中所提出的定義被普遍接受——數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策(Decision Making Support)。
數據倉庫的架構領域在理論知識上存在着兩大流派,它們分別是由兩位大師Ralph Kimball&Bill Inmon,在上世紀 90年代初提出。這兩位大師均是商業智能/數據倉庫領域的泰斗宗師級人物、理論家, 可是他們兩位的理念和思路有較大差別。他們的跟隨者之間也常常有關於哪一種架構和建設方式更優的辯論。
在國內,咱們一般所說的數據倉庫的四個特性角度的定義(面向主題、集成、相對穩定、 反映歷史變化,用於支持決策),就是inmon提出來的,他也被稱爲數據倉庫之父。而實踐大師kimball他的的工具箱系列著做,亦被奉爲數據倉庫建設的經典書籍。


從數據庫到數據倉庫

兩者的區別:
一、出發點不一樣:數據庫是面向事務的設計;數據倉庫是面向主題設計的。
二、存儲的數據不一樣:數據庫通常存儲在線交易數據;數據倉庫存儲的通常是歷史數據。
三、設計規則不一樣:數據庫設計是儘可能避免冗餘,通常採用符合範式的規則來設計;數據倉庫在設計是有意引入冗餘,採用反範式的方式來設計。
四、提供的功能不一樣:數據庫是爲捕獲數據而設計,數據倉庫是爲分析數據而設計,
五、基本元素不一樣:數據庫的基本元素是事實表,數據倉庫的基本元素是維度表。
六、容量不一樣:數據庫在基本容量上要比數據倉庫小的多。
七、服務對象不一樣:數據庫是爲了高效的事務處理而設計的,服務對象爲企業業務處理方面的工做人員;數據倉庫是爲了分析數據進行決策而設計的,服務對象爲企業高層決策人員。


企業的數據處理大體分爲兩類:
一類是操做型處理,也稱爲聯機事務處理,它是針對具體業務在數據庫聯機的平常操做,一般對少數記錄進行查詢、修改。
另外一類是分析型處理,通常針對某些主題的歷史數據進行分析,支持管理決策。數據倉庫,數據挖掘
OLTP    二維關係        聯機事務處理    On-Line Transaction Processing    
OLAP    多維關係        聯機分析處理    On-Line Analytical Processing    數據倉庫,數據挖掘
OLTP是傳統的關係型數據庫的主要應用,主要是基本的、平常的事務處理,例如銀行交易。
OLAP是數據倉庫系統的主要應用,支持複雜的分析操做,側重決策支持,而且提供直觀易懂的查詢結果。

聯機分析處理 (OLAP) 的概念最先是由關係數據庫之父E.F.Codd於1993年提出的,他同時提出了關於OLAP的12條準則。OLAP的提出引發了很大的反響,OLAP做爲一類產品同聯機事務處理 (OLTP) 明顯區分開來。

ui

 

 

  
OLTP
OLAP
用戶
操做人員,低層管理人員
決策人員,高級管理人員
功能
平常操做處理
分析決策
DB 設計
面向應用
面向主題
數據
當前的, 最新的細節的, 二維的分立的
歷史的, 彙集的, 多維的,集成的, 統一的
存取
讀/寫數十條記錄
讀上百萬條記錄
工做單位
簡單的事務
複雜的查詢
DB 大小
100MB-GB
100GB-TB

 

 

奧威Power-BI 包含ETL+DW+OLAP+DM+Dashboard+Query+Report等全部BI工具spa

數據可視化設計

對於數據分析人員,再也不依賴IT開發人員,隨需而動,任意組合,任意篩選,任意聯動,任意鑽取,個人數據我做主,真正實現自助式BI應用
對於IT開發人員,再也不須要無止境的響應數據分析人員的個性化需求,專一構建數據中心與分析模型,保證有數據,準確,以及正確的訪問權限便可。orm

相關文章
相關標籤/搜索