《BI那點兒事》SQL Server 2008體系架構

原文: 《BI那點兒事》SQL Server 2008體系架構

Microsoft SQL Server是一個提供了聯機事務處理、數據倉庫、電子商務應用的數據庫和數據分析的平臺。
體系架構是描述系統組成要素和要素之間關係的方式。Microsoft SQL Server系統的體系結構是對Microsoft SQL Server的主要組成部分和這些組成部分之間關係的描述。
Microsoft SQL Server 2008系統由4個主要部分組成,這4個部分被稱爲4個服務,這些服務分別是數據庫引擎、分析服務、報表服務和集成服務,這些服務之間相互存在和相互應用,它們的關係示意圖如圖所示。
SQL Server 2008體系架構示意圖

html

數據庫引擎
數據庫引擎(SQL Server Database Engine,SSDE)是Microsoft SQL Server 2008統的核心服務,負責完成業務數據的存儲、處理、查詢和安全管理。
例如,建立數據庫、建立表、執行各類數據查詢、訪問數據庫等操做,都是由數據庫引擎完成的。
在大多數狀況下,使用數據庫系統實際上就是使用數據庫引擎。
例如,在某個使用Microsoft SQL Server 2008系統做爲後臺數據庫的航空公司機票銷售信息系統中, Microsoft SQL Server 2008系統的數據庫引擎服務負責完成機票銷售數據的添加、更新、刪除、查詢及安全控制等操做。 數據庫

功能組件
數據庫引擎自己也是一個複雜的系統,它包括了許多功能組件,例如Service Broker、複製、全文搜索、通知服務等。
Service Broker提供了異步通訊機制,能夠用於存儲、傳遞消息。
複製是指在不一樣的數據庫之間對數據和數據庫對象進行復制和分發,保證數據庫之間同步和數據一致性的技術。複製常常用於物理位置不一樣的服務器之間的數據分發,它能夠經過局域網、廣域網、撥號鏈接、無線鏈接和 Internet 分發到不一樣位置的遠程或移動用戶。
全文搜索提供了基於關鍵字的企業級的搜索功能。
通知服務提供了基於通知的開發和部署平臺。 編程

分析服務

分析服務(SQL Server Analysis Services,SSAS)提供了OLAP和數據挖掘功能,能夠支持用戶創建數據倉庫。
相對OLAP來講,OLTP是由數據庫引擎負責完成的。使用SSAS服務,能夠設計、建立和管理包含了來自於其餘數據源數據的多維結構,經過對多維數據進行多個角度的分析,能夠支持管理人員對業務數據的更全面的理解。
另外,經過使用SSAS服務,用戶能夠完成數據挖掘模型的構造和應用,實現知識發現、表示和管理。
例如,在航空公司的機票銷售信息系統中,可使用Microsoft SQL Server 2008系統提供的SSAS服務完成對客戶的數據挖掘分析,能夠發現更多有價值的信息和知識,從而爲減小客戶流失、提升客戶管理水平提供有效的支持。
分析服務的主要組件是Business Intelligence Development Studio(簡稱爲BIDS)。BIDS是一個管理工具,爲集成服務、報表服務、分析服務和數據挖掘等提供了一個集成平臺。基於Visual Studio 2008的BIDS支持用戶開發商業智能應用程序,用戶能夠在該平臺中進行編寫代碼、調試及版本控制等工做。安全

分析服務概述服務器

SQL Server 2008中包含了一個SQL Server 2008分析服務的單獨程序,能夠用來對SQL Server和其餘OLE DB數據庫執行OLAP分析。架構

 

建立分析服務項目異步

使用分析服務,首先就必須建立分析服務項目。一個分析服務項目包含數據源、數據源視圖、多維數據集、維度、挖掘結構、角色、程序集和雜項8個子文件夾,每一個文件夾中存放相應的對象。工具

 

建立多維數據集佈局

建立多維數據集的方法有兩種:第一種方法是先定義獨立於任何多維數據集的維度,而後再定義基於這些維度的一個多維數據集;第二種方法是使用「多維數據集嚮導」來建立多維數據集和相關維度。post

 

處理和瀏覽多維數據集

處理多維數據集將使分析服務預先計算包含多維數據集中數據的聚合。

添加篩選條件

在瀏覽多維數據集時,能夠爲顯示的數據添加一些篩選條件,更精確地去分析數據。

 

使用數據挖掘嚮導

使用分析服務提供的數據挖掘嚮導,對當前多維數據集進行挖掘分析。

 

報表服務

報表服務(SQL Server Reporting Services,SSRS)爲用戶提供了支持Web的企業級的報表功能。
經過使用Microsoft SQL Server 2008系統提供的SSRS服務,用戶能夠方便地定義和發佈知足本身需求的報表。
不管是報表的佈局格式,仍是報表的數據源,用戶均可以輕鬆地實現。
這種服務極大地便利了企業的管理工做,知足了管理人員高效、規範的管理需求。
例如,在航空公司的機票銷售信息系統中,使用Microsoft SQL Server 2008系統提供的SSRS服務能夠方便地生成Word、PDF、Excel等格式的報表。

報表服務概述

SQL Server 2008報表服務(Reporting Services,SSRS)提供了各類現成可用的工具和服務,幫助數據庫管理員建立、部署和管理單位的報表,並提供了可以擴展和自定義報表功能的編程功能。

使用報表嚮導設計報表

使用報表嚮導建立報表是比較經常使用且簡單的方法,其實現過程在Microsoft SQL Server 2008的工具Business Intelligence Development Studio(BIDS)中完成。

使用報表設計器

雖然使用報表嚮導能夠快速地建立報表,知足大多數用戶的需求,但對於建立複雜或者自由格式的報表仍是具備必定的侷限性。在這種狀況下,就可使用報表設計器來自主設計報表。

設計參數化報表

建立報表以後,爲了進一步精確報表中顯示的數據,能夠經過爲報表添加參數的方式控制報表中包含的數據信息。在SQL Server 2008中能夠利用輸入值來維護報表,則稱這種報表爲參數化的報表。

配置報表服務器

對當前報表服務器的內容進行配置。

發佈報表

設計好一個報表以後,須要將該報表發佈到已經設置好的報表服務器上,供其餘人查看。

管理報表

在報表管理器中,管理員能夠對已經發布的報表進行管理,好比建立文件夾、刪除文件和轉移文件等操做。

集成服務
集成服務(SQL Server Integration Services,SSIS)是一個數據集成平臺,能夠完成有關數據的提取、轉換、加載等。
例如,對於分析服務來講,數據庫引擎是一個重要的數據源,如何將數據源中的數據通過適當地處理加載到分析服務中以便進行各類分析處理,這正是SSIS服務所要解決的問題。
重要的是,SSIS服務能夠高效地處理各類各樣的數據源,除了Microsoft SQL Server數據以外,還能夠處理Oracle、Excel、XML文檔、文本文件等數據源中的數據。

SSIS是Microsoft SQL Server 2005/8 Integration Services的簡稱,是生成高性能數據集成解決方案.
包括數據的抽取,轉換,加載的一個平臺,簡稱ETL。這個平臺主要是用於商業智能中,來抽取數據適合的數據到數據倉庫的一個工具,固然也能夠用到通常的系統中,作數據的導入,導出等。
俗話說:「十年磨一劍」,Microsoft 經過5年時間的精心打造,於2005年濃重推出Sql Server 2005,這是自SQL Server 2000 之後的又一曠世之做。這套企業級的數據庫解決方案,主要包含了如下幾個方面:數據庫引擎服務、數據挖掘、Analysis Services、Integration Services、Reporting Services 這幾個方面,其中Integration Services (即SSIS),就是他們之間的中轉站、紐帶,將各類源頭的數據,經ETL到數據倉庫,創建多維數據集,而後進行分析、挖掘並將結果經過Reporting Services 送達給企業各級用戶,爲企業的規劃決策、監督執行保駕護航。

如今不少人都把SSIS 說成是一個ETL (Extract-Transform-Load)工具,我我的以爲不太準確,或許是你們基本上都把他作爲ETL 使用,其實SSIS已經超越了ETL的功能,ETL 僅是其中之一,它在其它方面也有很是突出的表現:

在數據庫維護方面

數據庫備份;

統計信息更新;

數據庫完整性檢查;

索引重建

SSIS 包執行;

SSAS 任務處理。

業務處理

執行SQL 任務。

Web Service 任務。

操做系統維護

WMI事件觀察器任務

文件系統任務。

其它

執行SQL 任務

執行進程任務

ActiveX 腳本任務

腳本任務(VB/C#).

執行Web Service 服務

 

尤爲是上面的第四點,能夠執行SQL 任務,能夠執行Web Service 服務,能夠執行系統進程,能夠執行(VB/C#)腳本任務,這給了咱們多大想象的空間,還有什麼例外的?強啊。不得不佩服務一下。

  SSIS(SQLServer集成服務)是一個嵌入式應用程序,用於開發和執行ETL(解壓縮、轉換和加載)包。SSIS代替了SQL2000的DTS。整合服務功能既包含了實現簡單的導入導出包所必需的Wizard導向插件、工具以及任務,也有很是複雜的數據清理功能。SQLServer2008SSIS的功能有很大的改進和加強,好比它的執行程序可以更好地並行執行。在SSIS2005,數據管道不能跨越兩個處理器。而SSIS2008可以在多處理器機器上跨越兩個處理器。並且它在處理大件包上面的性能獲得了提升。SSIS引擎更加穩定,鎖死率更低。
Lookup功能也獲得了改進。Lookup是SSIS一個經常使用的獲取相關信息的功能。好比從CustomerID查找CustomerName,獲取數據集。Lookup在 SSIS中很常見,並且能夠處理上百萬行的數據集,所以性能可能不好。SQL2008對Lookup的性能做出很大的改進,並且可以處理不一樣的數據源, 包括ADO.NET,XML,OLEDB和其餘SSIS壓縮包。

SSIS 應用場景
SSIS 應用主要是在一些商業智能的大型數據系統中,對數據的抽取,清洗等,以得到高質量的數據,是企業在作分析的時候分析出準確的結果。同時SSIS也會應用於平常的數據管理中,好比一些DBA對數據庫的管理,對數據庫Job的管理,對數據庫的遷移,合併等工做。

SSIS 的體系結構
主要由四部分組成:Integration Services 服務、Integration Services 對象模型、Integration Services 運行時和運行時可執行文件以及封裝數據流引擎和數據流組件的數據流任務(如圖):

相關文章
相關標籤/搜索