整個數據倉庫環境的核心,是數據存放的地方和提供對數據檢索的支持。相對於操縱型數據庫來講其突出的特色是對海量數據的支持和快速的檢索技術。數據庫
把數據從各類各樣的存儲方式中拿出來,進行必要的轉化、整理,再存放到數據倉庫內。安全
對各類不一樣數據存儲方式的訪問能力是數據抽取工具的關鍵,應能生成COBOL程序、MVS做業控制語言(JCL)、UNIX腳本、和SQL語句等,以訪問不一樣的數據。服務器
數據轉換都包括,刪除對決策應用沒有意義的數據段;轉換到統一的數據名稱和定義;計算統計和衍生數據;給缺值數據賦給缺省值;把不一樣的數據定義方式統一。數據結構
描述數據倉庫內數據的結構和創建方法的數據。可將其按用途的不一樣分爲兩類,技術元數據和商業元數據。工具
技術元數據是數據倉庫的設計和管理人員用於開發和平常管理數據倉庫是用的數據。包括:數據源信息;數據轉換的描述;數據倉庫內對象和數據結構的定義;數據清理和數據更新時用的規則;源數據到目的數據的映射;用戶訪問權限,數據備份歷史記錄,數據導入歷史記錄,信息發佈歷史記錄等。開發工具
商業元數據從商業業務的角度描述了數據倉庫中的數據。包括:業務主題的描述,包含的數據、查詢、報表;設計
元數據爲訪問數據倉庫提供了一個信息目錄(informationdirectory),這個目錄全面描述了數據倉庫中都有什麼數據、這些數據怎麼獲得的、和怎麼訪問這些數據。是數據倉庫運行和維護的中心,數據倉庫服務器利用他來存貯和更新數據,用戶經過他來了解和訪問數據。orm
爲用戶訪問數據倉庫提供手段。有數據查詢和報表工具;應用開發工具;管理信息系統(EIS)工具;在線分析(OLAP)工具;數據挖掘工具。對象
爲了特定的應用目的或應用範圍,而從數據倉庫中獨立出來的一部分數據,也可稱爲部門數據或主題數據(subjectarea)。在數據倉庫的實施過程當中每每能夠從一個部門的數據集市着手,之後再用幾個數據集市組成一個完整的數據倉庫。須要注意的就是再實施不一樣的數據集市時,同一含義的字段定義必定要相容,這樣再之後實施數據倉庫時纔不會形成大麻煩。開發
安全和特權管理;跟蹤數據的更新;數據質量檢查;管理和更新元數據;審計和報告數據倉庫的使用和狀態;刪除數據;複製、分割和分發數據;備份和恢復;存儲管理。
信息發佈系統:把數據倉庫中的數據或其餘相關的數據發送給不一樣的地點或用戶。基於Web的信息發佈系統是對付多用戶訪問的最有效方法。