DB、ETL、DW、OLAP、DM、BI關係結構圖

DB、ETL、DW、OLAP、DM、BI關係結構圖

201504021339132.jpg

在此大概用口水話簡單敘述一下他們幾個概念:數據庫

(1)DB/Database/數據庫——這裏通常指的就是OLTP數據庫,在線事物數據庫,用來支持生產的,好比超市的買賣系統。DB保留的是數據信息的最新狀態,只有一個狀態!好比,天天早上起牀洗臉照鏡子,看到的就是當時的狀態,至於以前的天天的狀態,不會出現的你的眼前,這個眼前就是db。大數據


(2)DW/Data Warehouse/數據倉庫——這裏保存的是DB中的不一樣時間點的狀態,好比,天天早上洗完照鏡子時,都拍一張照片,每天這樣,這些照片放入到一個相冊中,以後就能夠查看每一天的狀態了,這個相冊就是數據倉庫,他保存的是數據在不一樣時間點的狀態,對同一個數據信息,保留不一樣時間點的狀態,就便於咱們作統計分析了。
spa


(3)ETL/Extraction-Transformation-Loading——用於完成DB到DW的數據轉存,它將DB中的某一個時間點的狀態,「抽取」出來,根據DW的存儲模型要求,「轉換」一下數據格式,而後再「加載」到DW的一個過程,這裏須要強調的是,DB的模型是ER模型,聽從範式化設計原則,而DW的數據模型是雪花型結構或者星型結構,用的是面向主題,面向問題的設計思路,因此DB和DW的模型結構不一樣,須要進行轉換。 
(4)OLAP——在線分析系統,簡單說就是報表系統,銷售報表,統計報表,等等,這個你們都熟悉,固然,OLAP的統計要更復雜更豐富一些,好比切面,鑽取等等。 
(5)DM/Data Mining/數據挖掘——這個挖掘,不是簡單的統計了,他是根據機率論的或者其餘的統計學原理,將DW中的大數據量進行分析,找出咱們不能直觀發現的規律,好比,若是咱們天天早上照相,量身材的時候,還記錄下頭一天吃的東西,黃瓜,豬腿,烤鴨,以及心情,若是記錄上10年,造成了3650天的相貌和飲食心情的數據,咱們每一個人都記錄,有20萬人記錄了,那麼,咱們也許經過這些記錄,能夠分析出,身材相貌和飲食的客觀規律;再說一個典型的實例,就是英國的超市,在積累了大量數據以後,對數據分析挖掘以後,獲得了一個規律:將小孩的尿布和啤酒放在一塊兒,銷量會更好——業務專家在獲得該結論以後,仔細分析,知道了緣由,由於英國男人喜歡看足球的多,老婆把小孩介紹男人看管,小孩尿尿須要尿布,而男人看足球喜歡喝酒,因此兩樣商品有密切的關係,放在一塊兒銷售會更好!
設計

 

 


(6)BI/Business Intelligence/商業智能——領導,決策者,在獲取了OLAP的統計信息,和DM獲得的科學規律以後,對生產進行適當的調整,好比,命令超市人員將啤酒喝尿布放在一塊兒銷售,這就副作用於DB修改存貨數據了——這就是整個BI的做用!
orm


信息技術通過近20年的大力發展,不少行業積累了不少珍貴的數據,真正的大數據時代到來了,也逐漸體現出 DB-ETL-DW-OLAP-DM-BI這條線路的重要性,但願你們能懂得這個大數據時代的價值,把握住機遇,有更加美好的將來!
數據分析

相關文章
相關標籤/搜索