SQL Server調優系列基礎篇

前言數據庫

關於SQL Server調優系列是一個龐大的內容體系,非一言兩語可以分析清楚,本篇先就在SQL 調優中所最經常使用的查詢計劃進行解析,力圖作好基礎的掌握,夯實基本功!然後再談談總體的語句調優。編程

經過本篇瞭解如何閱讀和理解查詢計劃、而且列舉一系列最經常使用的查詢執行運算符。緩存

技術準備服務器

基於SQL Server2008R2版本,利用微軟的一個更簡潔的案例庫(Northwind)進行解析。 併發

1、區別不一樣的運算符編輯器

在全部T-SQL語句在執行的時候,都會將語句分解爲一些基本的結構單元,這些結構單元統稱爲:運算符。每個運算符都實現一個單獨的基本操做,好比:表掃描、索引查找、索引掃描、過濾等。每一個運算符能夠循環迭代,也能夠延續子運算符,這樣就能夠組成查詢樹,即:查詢計劃。性能

每一個T-SQL語句都會經過多種運算符進行組合造成不一樣的查詢計劃,而且這些查詢計劃對於結果的篩選都是有效的,但在執行的時候,SQL Server的查詢優化器會自動爲咱們找到一個最優的。優化

每個運算符都會有源數據的傳入和結果數據的輸出,源數據的輸入能夠來源於其它的運算符或者直接從數據源表中讀取,通過自己的運算進行結果的輸出。因此每個運算符是獨立的。互不關心的。線程

以下例子3d

SELECT COUNT(*) FROM Orders

此語句會生成兩個簡單的運算符

固然,在SQL Server中上述的兩個運算符有它本身的表達方式,Count(*)是流聚合運算符進行的。

每個運算符會有三個屬性影響其執行的效率

一、內存消耗

全部的運算符都須要必定量的固定內存用以完成執行。當一個T-SQL語句通過編譯後生成查詢計劃後,SQL Server會爲認爲最優的查詢計劃嘗試去固定內存,目的是爲了再次執行的時候不須要再從新申請內存而浪費時間,加快執行速度。

而後,有一些運算符須要額外的內存空間來存儲行數據,這樣的運算符所須要的內存量一般就和處理的數據行數成正比。若是出現以下幾種狀況則會致使內存不能申請到,而影響執行性能

a、若是服務器上正在執行其它的相似的內存消耗巨大的查詢,致使系統內存剩餘不足的時候,當前的查詢就得延遲進行,直接影響性能。

b、當併發量過大的的狀況下,多個查詢競爭有限的內存資源,服務器會適當的控制併發和減小吞吐量來維護機器性能,這時候一樣也會影響性能

c、若是當前申請的到可用內存不多的狀況下,SQL Server會在執行過程當中和磁盤進行交換數據,一般是使用Tempdb臨時庫進行操做,而這個過程會很慢。更有甚者,會耗盡Tempdb上的磁盤空間以失敗結束

一般比較消耗內存的運算符主要有分類、哈希鏈接以及哈希聚合等鏈接操做。

二、阻斷運算和非阻斷運算

所謂阻斷和非阻斷的區別就是:運算符是否在輸入數據的時候可以直接輸出結果數據。

a、當一個運算符在消耗輸入行的同時生成輸出行,這種運算符就是非阻斷式的。

好比咱們常用的 Select Top ...操做,此操做就是輸入行的同時進行輸出行操做,因此此操做就是非阻斷式的。

b、當一個運算符所產生的輸出結果須要等待全部的數據輸入的時候,這個操做運算就是阻斷運算的。

好比上面咱們舉的例子Count(*)操做,此操做就須要等待全部的數據行輸入才能計算出,因此爲阻斷式運算,另外還有分組計算。

 提示:並非全部的阻斷式操做就須要消耗內存,好比Count(*)就爲阻斷式,但它不消耗內存,但大部分阻斷式操做都會消耗內存。

在大部分的OLTP系統中,咱們要儘可能的使用非阻斷式操做來代替阻斷式操做,這樣才能更好的提升相應時間,好比有時候咱們用EXISTS子查詢來判斷,比用SELECT count(*)>0的速度要理想的多。

 

2、查看查詢計劃

在SQL Server2005版本以上,系統提供了三種展現方式:圖像方式、文本方式和XML方式。

一、圖像方式

圖像方式這種方式是最爲常見的一種方式,清晰、簡潔、易懂。很是適合入門級,固然也有它自身的缺點好比複雜的T-SQL語句會產生較大的圖像,查看必須收縮操做,比較麻煩。

SSMS默認給咱們提供了查看該查詢計劃的便捷按鈕,須要查看某一條語句的時候,只須要點擊上就能夠

咱們來看一個圖像方式展現的查詢計劃圖

以上查詢語句所產生的實際執行計劃,將其分紅了各個不一樣的運算符進行組合,從最右側的彙集索引掃描(index scan)而後通過一系列的運算符加工造成最左側的結果輸出(select)。

須要注意的是圖中箭頭的方向指向的是數據的流向,箭頭線的粗細表示了數據量的多少。

在圖形化執行計劃中,每個不一樣的運算符都有它自身的屬性值,咱們能夠把鼠標移至運算符圖標上查看

 固然也能夠直接在圖標上右鍵,查看屬性,進入到屬性面板,查看更詳細的屬性值

關於這裏面各個運算符的詳細指標值,咱們在後面介紹,不過這裏面有幾個關鍵的值這裏能夠說是先稍微提一下,關於影響此語句的總體的性能參數,咱們能夠選擇最開始的Select運算符,右鍵查看屬性值

此運算符包含了整條語句的編譯時間、所需內存、緩存計劃大小、並行度、內存受權、編譯執行所須要的參數以及變量值等信息。

此方式做爲一種相對直觀的方式展現給用戶,因此在咱們語句調優中佔據很大的指導地位,咱們知道一條T-SQL語句可能會生成不少不一樣的執行計劃,而SQL Server會幫助咱們選擇最優的執行計劃,固然咱們也能夠利用它選擇的執行計劃去調整本身的語句達到優化的目的。

鑑於以上目標,SSMS爲咱們提供了「評估執行計劃」選項,此選項只爲評估指導使用,並未實際執行,因此它不包含實際行等具體信息

二、文本方式

此方式在SSMS中默認沒有提供快捷鍵,咱們須要本身用語句開啓,開啓的方式有兩種

a、只開啓執行計劃,不包括詳細的評估值

SET SHOWPLAN_TEXT ON

b、開啓全部的執行計劃明細,包括各個屬性的評估值 

SET SHOWPLAN_ALL ON 

文本方式展示的方式,沒有了明確的箭頭指示,改用豎線(|)標示子運算符和當前運算的子父關係。而且數據流方向都是從子運算符流向父運算符的,雖然文本展示方式不夠直觀,可是若是掌握了文本的閱讀方式,此方式會更易閱讀,尤爲在涉及很大的大型計劃的時候,此方式更容易保存、處理、搜索和比較。

咱們來看一個列子

此種方式輸出的形式爲文本方式,咱們能夠拷貝至文本編輯器中分析,方便於查找分析等操做

 

以上是文本查詢計劃的分析方式,簡單點的就是從最裏面的運算符開始執行,數據流方向也是依次從子運算符流向父運算符。

上面的方式看起來有點圖像方式,分析起來簡單更易用。可是或許缺乏的是每一個運算符的屬性運算信息,咱們經過b方法裏來查看明細

利用此方式能夠直觀的分析出每一個運算符操做的屬性評估值。

三、XML方式

XML展示查詢計劃的方式是SQL Server2005中新加入的功能,此方式結合了文本方式和圖形計劃方式的優勢。利用XML元素的方式展示查詢計劃。

更主要的特色是利用XML方式是一種規範的方式,能夠利用編程的方式進行標準XML操做,利於查詢。而且在SQL Server2005中還加入的XML的數據類型,而且內置了XQuery功能進行查詢。此方式尤爲對與超大型的查詢計劃查看很是的方便。

經過如下語句開啓

SET STATISTICS XML ON 

咱們能夠點擊輸出的XML進行查看

XML方式展示了很是詳細的查詢計劃信息,咱們能夠簡單的分析下

  • StmtSimple:描述了T-SQL的執行文本,而且詳細分析了該語句的類型,以及各個屬性的評估值。
  • StatementSetOptions:描述該語句的各類屬性值的Set值
  • QueryPlan:是詳細的執行計劃,包括執行計劃的並行的線程數、編譯時間、內存佔有量等
  • OutputList:輸出參數列表
  • 在中間這部分就是具體的不一樣的執行運算符的信息了,而且包括詳細的預估值等
  • ParameterList:輸出參數列表

XML方式提供的信息是最爲全面的,而且在SQL Server內部存儲的查詢計劃類型也爲XML數據類型。

3、分析查詢計劃 

當咱們拿到一個語句的查詢計劃,咱們應該會分析裏面的執行計劃的含義,以及各個運算符的屬性值,學會如何調整各個運算符的屬性值來總體的提升該語句的運行效率。

一、掃描以及查找

對於掃描(scan)和查找(seek)這兩種方式是數據庫裏面從基礎數據表裏獲取的數據的基本方式。

a、當一張表爲堆表(沒有任何索引)的時候或者獲取的數據列不存在任何索引來供查找,此種數據的獲取只能經過全表掃描過濾獲取,若是存在索引項會經過索引項的掃描來獲取數據,提升獲取數據的速度。

該方法是最爲簡單的獲取數據的方式

b、若是當前搜尋的數據行存在索引項,那麼會採起索引查找(seek)進行數據檢索。

該條語句就是執行的索引查找,由於在Orders表中的OrderDate列存在非彙集索引項。這裏順便提一下若是引入靜態變量,SQL Server會自動參數化該值,目的是爲了減小編譯次數,重複利用執行計劃。

因爲查找只是搜尋符合條件的這些頁進行輸出操做,因此查找效率只和符合條件的行數、頁數成正比,和整個表中的總行數沒有關係。

c、當所選的索引列不包含輸出列的時候,也就是說要篩選出的列項不爲索引所覆蓋,對於這種狀況又引出了另一種查找方式

書籤查找(Bookmark Lookup)

其實該方式是掃描和查找之間的一個折中方式,咱們知道,若是經過彙集索引掃描,則會獲取全部的列,可是這涉及表中的每一行數據,影響性能,相反若是隻是經過彙集索引方式進行查找,則有一些列不能獲取獲得,若是這些列正是咱們須要的,這就是不許確的,因此,鑑於此,引入了折中的方式:書籤查找(Bookmark Lookup)

簡單點講:書籤查找就是經過索引頁節點數據查找相關的列數據。

咱們來看一個具體的查詢列子

這裏須要解釋一下,在SQL Server2005 SP2版本以上,書籤查找也被稱爲鍵查找,實際上是一個概念。

這種方式有一些弊端,就是在進行書籤查找的時候,若是經過非彙集索引的葉節點查找到彙集索引數據,這種狀況經過彙集索引可以快速的獲取到數據,若是非彙集索引關鍵字和彙集索引關鍵字不存在任何關聯,這種狀況下,書籤查找就會執行隨機的I/O操做到彙集索引或者堆表中,而這種狀況是很是耗時的,相比而言順序I/O掃描都要比隨機I/O掃描性能好不少。

爲了解決上面所述的問題,在SQL Server2005之後的版本中,在建立index的時候引入了INCLUDE關鍵字。經過建立索引的時候,直接將書籤要查找的項直接包含進去,這樣就不會發生隨機I/O操做。此種方式的缺點會形成索引存儲增大一部分,但相比帶來的好處,基本能夠忽略不計。

 

 

結語

此篇文章先到此吧,本篇主要介紹了關於T-SQL語句調優從執行計劃該以下下手,並介紹了幾個常見的簡單運算符,下一篇將着重介紹咱們最經常使用的一些運算符和調優技巧,包括:鏈接運算符、聚合運算符、聯合運算符、並行運算等吧,關於SQL Server性能調優的內容涉及面很廣,後續文章中依次展開分析。

相關文章
相關標籤/搜索