數據倉庫到搭建數據集市

數據倉庫是一種關係數據庫模式,其中保存了來自一個或者多個源數據庫的歷史數據和元數據。數據倉庫的目的便於將數據的報告和分析彙總到多個層次數據庫

或者更簡單點:是做爲一個存放企業各個領域的數據的單獨且有組織的庫。工具

典型的數據倉庫有如下的一些特色:oop

涉及多個主題域接口

有十分詳細的信息hadoop

集合來自不一樣數據源的數據數據

不必定使用維模型,但提供維模型集合

另外一方面,數據集市是數據倉庫的一個訪問層,用於從數據倉庫抽取相關的數據給用戶,數據集市是數據倉庫的一個子集,一般面向特定的業務線或者團隊(財政部門、市場部門、銷售部門等都有他們本身的數據集市data mart).data

數據集市:一個獨立的數據集市是更大的數據倉庫的一個邏輯子集或者物理子集,一般是相互獨立的,由於數據模式和模型彼此間是不一樣的。微軟提出的Tabular模型則是的你能夠直接從數據倉庫抽取數據而無需從數據集市抽取數據。模型

本人使用 Hive搭建數據倉庫,hadoop生態圈能夠提供不少工具和接口進行搭建企業級數據倉庫。ab

相關文章
相關標籤/搜索