MSSQLSERVER執行計劃詳解

1、數據查詢部分html

一、 看到執行計劃有兩種方式,對sql語句按Ctrl+L,或按Ctrl+M打開顯示執行計劃窗口每次執行sql都會顯示出相應的執行計劃算法

二、 執行計劃的圖表是從右向左看的sql

三、 SQL Server有幾種方式查找數據記錄數據庫

[Table Scan] 表掃描(最慢),對錶記錄逐行進行檢查緩存

[Clustered Index Scan] 彙集索引掃描(較慢),按彙集索引對記錄逐行進行檢查數據結構

[Index Scan] 索引掃描(普通),根據索引濾出部分數據在進行逐行檢查工具

[Index Seek] 索引查找(較快),根據索引定位記錄所在位置再取出記錄oop

[Clustered Index Seek] 彙集索引查找(最快),直接根據彙集索引獲取記錄性能

(若是有些sql執行很慢能夠看一下執行計劃是否包含太多「掃描」操做,若是有能夠考慮爲這些字段創建索引,創建索引切記不要再常常有更新操做的字段上創建,每次更新都會致使重建索引的操做,也會影響性能,0或1這種標識狀態的字段由於大部分數據都是同樣的創建索引也沒有什麼做用)優化

(索引就兩種,1是彙集索引,2個非彙集索引,彙集索引每張表只能有一個,非彙集索引每張表能夠有多個,主鍵Id就是典型的彙集索引,彙集索引是順序排列的相似於字典查找拼音a、b、c……和字典文字內容順序是相同的,非彙集索引與內容是非順序排列的,相似字典偏旁查找時,同一個偏旁‘馬’的漢字可能一個在第10頁一個在第100頁)

四、  

⑴沒有主鍵的表查詢[表掃描]

⑵有主鍵的表查詢[彙集索引掃描]

⑶創建非彙集索引的表查詢[索引掃描+書籤查找]

書籤查找:經過非彙集索引找到所求的行,但這個索引並不包含顯示的列,所以還要額外去基本表中找到這些列,因此要進行鍵查找,若是基本表在堆中則Key Lookup會變成RID查找,這兩個查找統稱爲書籤查找。

⑷創建非彙集索引並把其餘顯示列加入索引中[索引查找]

⑸創建非彙集索引並把其餘顯示列加入索引中並把彙集索引列看成條件[彙集索引查找]

 

 

 

本篇主要目的有二:

一、看懂t-sql的執行計劃,明白執行計劃中的一些常識。

二、可以分析執行計劃,找到優化sql性能的思路或方案。

若是你對sql查詢優化的理解或常識不是很深刻,那麼推薦幾騙博文給你:SqlServer性能檢測和優化工具使用詳細 ,sql語句的優化分析T-sql語句查詢執行順序

執行計劃簡介

一、什麼是執行計劃?

大哥提交的sql語句,數據庫查詢優化器,通過分析生成多個數據庫能夠識別的高效執行查詢方式。而後優化器會在衆多執行計劃中找出一個資源使用最少,而不是最快的執行方案,給你展現出來,能夠是xml格式,文本格式,也能夠是圖形化的執行方案。

二、預估執行計劃,實際執行計劃

選擇語句,點擊上面其中一個執行計劃,預估執行計劃能夠當即顯示,而實際執行計劃則須要執行sql語句後出現。預估執行計劃不等於實際執行計劃,可是絕大多數狀況下實際的執行計劃跟預估執行計劃都是一致的。統計信息變動或者執行計劃重編譯等狀況下,會形成不一樣。

SET STATISTICS PROFILE 和 SET STATISTICS XML 彼此互爲對等物。 前者生成文本輸出;後者生成 XML 輸出。 在 SQL Server 的將來版本中,新的查詢執行計劃信息將只經過 SET STATISTICS XML 語句顯示,而不經過 SET STATISTICS PROFILE 語句顯示。

https://docs.microsoft.com/zh-cn/sql/relational-databases/performance/display-an-actual-execution-plan?view=sql-server-2017

 

三、爲何要讀懂執行計劃

首先執行計劃讓你知道你複雜的sql究竟是怎麼執行的,有沒有按照你想的方案執行,有沒有按照最高效的方式執行,使用啦衆多索引的哪個,怎麼排序,怎麼合併數據的,有沒有形成沒必要要資源浪費等等。官方數據顯示,執行t-sql存在問題,80%均可以在執行計劃中找到答案。

四、針對圖形化執行計劃分析

執行計劃,能夠以文本,xml,圖形化展現出來。本騙主要以圖形化執行計劃主導進行分析,然而執行計劃中包含78個可用的操做符,本篇也只能對經常使用的進行分析,經常使用的幾乎就包含你平常全部的了。Msdn上有圖片介紹:https://msdn.microsoft.com/zh-cn/library/ms175913(v=sql.90).aspx

五、怎麼看執行計劃

圖形化執行計劃是從上到下從又到左看的。

六、清除緩存的執行計劃

dbcc freeprocache

dbcc flushprocindb(db_id)

看懂圖形化執行計劃

一、連線

一、越粗表示掃描影響的行數愈多。

二、Actual Number of Rows  掃描中實際影響的的行數。

三、Estimated Number of Rows 預估掃描影響的行數。

四、Estimated row size 操做符生成的行的估計大小(字節)。

五、Estimated Data Size 預估影響的數據的大小。

二、Tooltips,當前步驟執行信息

  

Note:這個tips的信息告訴咱們執行的對象是什麼,採用的操做操做是什麼,查找的數據是什麼,使用的索引是什麼,排序與否,預估cpu、I/O、影響行數,實際行數等信息。具體參數清單參見msdn:https://msdn.microsoft.com/zh-cn/library/ms178071(v=sql.90).aspx

三、Table Scan(表掃描)

當表中沒有彙集索引,又沒有合適索引的狀況下,會出現這個操做。這個操做是很耗性能的,他的出現也意味着優化器要遍歷整張表去查找你所須要的數據。

四、Clustered Index Scan(彙集索引掃描)、Index Scan(非彙集索引掃描)

 

這個圖標兩個操做均可以使用,一個彙集索引掃描,一個是非彙集索引掃描。

彙集索引掃描:彙集索引的數據體積實際是就是表自己,也就是說表有多少行多少列,彙集全部就有多少行多少列,那麼彙集索引掃描就跟表掃描差很少,也要進行全表掃描,遍歷全部表數據,查找出你想要的數據。

非彙集索引掃描:非彙集索引的體積是根據你的索引建立狀況而定的,能夠只包含你要查詢的列。那麼進行非彙集索引掃描,即是你非彙集中包含的列的全部行進行遍歷,查找出你想要的數據。

五、Key Lookup(鍵值查找)

首先須要說的是查找,查找與掃描在性能上徹底不是一個級別的,掃描須要遍歷整張表,而查找只須要經過鍵值直接提取數據,返回結果,性能要好。

當你查找的列沒有徹底被非彙集索引包含,就須要使用鍵值查找在彙集索引上查找非彙集索引不包含的列。

六、RID Lookoup(RID查找)

 

跟鍵值查找相似,只不過RID查找,是須要查找的列沒有徹底被非彙集索引包含,而剩餘的列所在的表又不存在彙集索引,不能鍵值查找,只能根據行表示Rid來查詢數據。

七、Clustered Index Seek(彙集索引查找)、Index Seek(非彙集索引查找)

彙集索引查找和非彙集索引查找都是使用該圖標。

彙集索引查找:彙集索引包含整個表的數據,也就是在彙集索引的數據上根據鍵值取數據。

非彙集索引查找:非彙集索引包含建立索引時所包含列的數據,在這些非彙集索引的數據上根據鍵值取數據。

八、Hash Match

 

這個圖標有兩種地方用到,一種是表關聯,一種是數據聚合運算時。

再分別說這兩中運算的前面,我先說說Hashing(編碼技術)和Hash Table(數據結構)。

Hashing:在數據庫中根據每一行的數據內容,轉換成惟一符號格式,存放到臨時哈希表中,當須要原始數據時,能夠給還原回來。相似加密解密技術,可是他能更有效的支持數據查詢。

Hash Table:經過hashing處理,把數據以key/value的形式存儲在表格中,在數據庫中他被放在tempdb中。

接下來,來講說Hash Math的表關聯跟行數據聚合是怎麼操做運算的。

表關聯:

如上圖,關聯兩個數據集時,Hash Match會把其中較小的數據集,經過Hashing運算放入HashTable中,而後一行一行的遍歷較大的數據集與HashTable進行相應的匹配拉取數據。

數據聚合:當查詢中須要進行Count/Sum/Avg/Max/Min時,數據可能會採用把數據先放在內存中的HashTable中而後進行運算。

九、Nested Loops

這個操做符號,把兩個不一樣列的數據集彙總到一張表中。提示信息中的Output List中有兩個數據集,下面的數據集(inner set)會一一掃描與上面的數據集(out set),知道掃描完爲止,這個操做纔算是完成。

十、Merge Join

這種關聯算法是對兩個已經排過序的集合進行合併。若是兩個聚合是無序的則將先給集合排序再進行一一合併,因爲是排過序的集合,左右兩個集合自上而下合併效率是至關快的。

十一、Sort(排序)

對數據集合進行排序,須要注意的是,有些數據集合在索引掃描後是自帶排序的。

十二、Filter(篩選)

根據出如今having以後的操做運算符,進行篩選

1三、Computer Scalar

 

在須要查詢的列中須要自定義列,好比count(*) as cnt ,select name+''+age 等會出現此符號。

根據執行計劃細節要作的優化操做

這裏會有不少建議給出,我不一一舉例了,給出幾個示例,想作到優化行家,多的還須要你們去悟去理解。

一、若是select * 一般狀況下彙集索引會比非彙集索引更優。

二、若是出現Nested Loops,須要查下是否須要彙集索引,非彙集索引是否能夠包含全部須要的列。

三、Hash Match鏈接操做更適合於須要作Hashing算法集合很小的鏈接。

四、Merge Join時須要檢查下原有的集合是否已經有排序,若是沒有排序,使用索引可否解決。

五、出現表掃描,彙集索引掃描,非彙集索引掃描時,考慮語句是否能夠加where限制,select * 是否能夠去除沒必要要的列。

六、出現Rid查找時,是否能夠加索引優化解決。

七、在計劃中看到不是你想要的索引時,看可否在語句中強制使用你想用的索引解決問題,強制使用索引的辦法Select CluName1,CluName2 from Table with(index=IndexName)。

八、看到不是你想要的鏈接算法時,嘗試強制使用你想要的算法解決問題。強制使用鏈接算法的語句:select * from t1 left join t2 on t1.id=t2.id option(Hash/Loop/Merge Join)

九、看到不是你想要的聚合算法是,嘗試強制使用你想要的聚合算法。強制使用聚合算法的語句示例:select  age ,count(age) as cnt from t1 group by age  option(order/hash group)

十、看到不是你想要的解析執行順序是,或這解析順序耗時過大時,嘗試強制使用你定的執行順序。option(force order)

十一、看到有多個線程來合併執行你的sql語句而影響到性能時,嘗試強制是不併行操做。option(maxdop 1)

十二、在存儲過程當中,因爲參數不一樣致使執行計劃不一樣,也影響啦性能時嘗試指定參數來優化。option(optiomize for(@name='zlh'))

1三、不操做多餘的列,多餘的行,不作務必要的聚合,排序。

相關文章
相關標籤/搜索