探索MSSQL執行計劃

 最近總想整理下對MSSQL的一些理解與感悟,卻一直沒有心思和時間寫,晚上無事便寫了一篇探索MSSQL執行計劃,本文講執行計劃但不只限於講執行計劃。   程序員

網上的SQL優化的文章實在是不少,說實在的,我也曾經處處找這樣的文章,什麼不要使用IN了,什麼OR了,什麼AND了,不少不少,還有不少人拿出僅幾S甚至幾MS的時間差的例子來證實着什麼(有點好笑),讓許多人不知道其是對仍是錯。而SQL優化又是每一個要與數據庫打交道的程序員的必修課,因此寫了此文,與朋友們共勉。   數據庫

談到優化就必然要涉及索引,就像要講鎖必然要說事務同樣,因此你須要瞭解一下索引,僅僅是索引,就能講半天了,因此索引我就不說了(打不少字是很累的,何況我也知之甚少),能夠去參考相關的文章,這個網上資料比較多了。   緩存

今天來探索下MSSQL的執行計劃,來讓你們知道如何查看MSSQL的優化機制,以此來優化SQL查詢。 併發

 

--DROP TABLE T_UserInfo---------------------------------------------------- ide

--建測試表 函數

CREATE TABLE T_UserInfo 測試

( 優化

    Userid varchar(20),  UserName varchar(20), orm

    RegTime datetime, Tel varchar(20), 索引

)

--插入測試數據

DECLARE @I INT

DECLARE @ENDID INT

SELECT @I = 1

SELECT @ENDID = 100  --在此處更改要插入的數據,從新插入以前要刪掉全部數據

WHILE @I <= @ENDID

BEGIN

    INSERT INTO T_UserInfo

    SELECT 'ABCDE'+CAST(@I AS VARCHAR(20))+'EF','李'+CAST(@I AS VARCHAR(20)),

       GETDATE(),'876543'+CAST(@I AS VARCHAR(20))

    SELECT @I = @I + 1

END

 

--相關SQL語句解釋

---------------------------------------------------------------------------

--建彙集索引

CREATE CLUSTERED INDEX INDEX_Userid  ON T_UserInfo (Userid)

--建非彙集索引

CREATE NONCLUSTERED INDEX INDEX_Userid  ON T_UserInfo (Userid)

--刪除索引

DROP INDEX T_UserInfo.INDEX_Userid

---------------------------------------------------------------------------

---------------------------------------------------------------------------

--顯示有關由Transact-SQL 語句生成的磁盤活動量的信息

SET STATISTICS IO ON

--關閉有關由Transact-SQL 語句生成的磁盤活動量的信息

SET STATISTICS IO OFF

--顯示[返回有關語句執行狀況的詳細信息,並估計語句對資源的需求]

SET SHOWPLAN_ALL  ON

--關閉[返回有關語句執行狀況的詳細信息,並估計語句對資源的需求]

SET SHOWPLAN_ALL  OFF

---------------------------------------------------------------------------

請記住:SET STATISTICS IO 和 SET SHOWPLAN_ALL 是互斥的。

 

OK,如今開始:

首先,咱們插入100條數據

而後我寫了一個查詢語句:

SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

選中以上語句,按Ctrl+L,以下圖

 

 

這就是MSSQL的執行計劃:表掃描:掃描表中的行

 

而後咱們來看該語句對IO的讀寫:

執行:SET STATISTICS IO ON

此時再執行該SQL:SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

切換到消失欄顯示以下:

表'T_UserInfo'。掃描計數1,邏輯讀1 次,物理讀0 次,預讀0 次。

解釋下其意思:

四個值分別爲:

    執行的掃描次數;

    從數據緩存讀取的頁數;

    從磁盤讀取的頁數;

    爲進行查詢而放入緩存的頁數

重要:若是對於一個SQL查詢有多種寫法,那麼這四個值中的邏輯讀(logical reads)決定了哪一個是最優化的。

 

接下來咱們爲其建一個彙集索引

執行CREATE CLUSTERED INDEX INDEX_Userid  ON T_UserInfo (Userid)

而後再執行SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

切換到消息欄以下顯示:

表'T_UserInfo'。掃描計數1,邏輯讀2 次,物理讀0 次,預讀0 次。

此時邏輯讀由原來的1變成2,

說明咱們又加了一個索引頁,如今咱們查詢時,邏輯讀就是要讀兩頁(1索引頁+1數據頁),此時的效率還不如不建索引。

 

此時再選中查詢語句,而後再Ctrl+L,以下圖:

 

彙集索引查找:掃描彙集索引中特定範圍的行

說明,此時用了索引。

 

OK,到這裏你應該已經知道初步知道MSSQL查詢計劃和如何查看對IO的讀取消耗了吧!

 

 

接下來咱們繼續:

 

如今我再把測試數據改變成1000條

再執行SET STATISTICS IO ON,再執行

SELECT * FROM T_UserInfo WHERE USERID='ABCDE6EF'

在不加彙集索引的狀況下:

表'T_UserInfo'。掃描計數1,邏輯讀7 次,物理讀0 次,預讀0 次。

在加彙集索引的狀況下:CREATE CLUSTERED INDEX INDEX_Userid  ON T_UserInfo (Userid)

表'T_UserInfo'。掃描計數1,邏輯讀2 次,物理讀0 次,預讀0 次。

(其實也就是說此時是讀了一個索引頁,一個數據頁)

如此,在數據量稍大時,索引的查詢優點就顯示出來了。

 

 

 

先小總結下:

當你構建SQL語句時,按Ctrl+L就能夠看到語句是如何執行,是用索引掃描仍是表掃描?

經過SET STATISTICS IO ON 來查看邏輯讀,完成同一功能的不一樣SQL語句,邏輯讀

越小查詢速度越快(固然不要找那個只有幾百條記錄的例子來反我)。

   

咱們再繼續深刻:

OK,如今咱們再來看一次,咱們換個SQL語句,來看下MSSQL如何來執行的此SQL呢?

如今去掉索引:DROP INDEX T_UserInfo.INDEX_Userid

如今打開[顯示語句執行狀況的詳細信息]:SET SHOWPLAN_ALL  ON

而後再執行:SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

看結果欄:結果中有些具體參數,好比IO的消耗,CPU的消耗。

在這裏咱們只看StmtText:

SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

  |--Table Scan(OBJECT:([student].[dbo].[T_UserInfo]), WHERE:(like([T_UserInfo].[Userid], 'ABCDE8%', NULL)))

Ctrl+L看下此時的圖行執行計劃:

 

我再加上索引:

先關閉:SET SHOWPLAN_ALL OFF

再執行:CREATE CLUSTERED INDEX INDEX_Userid  ON T_UserInfo (Userid)

再開啓:SET SHOWPLAN_ALL ON

再執行:SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

查看StmtText:

SELECT * FROM T_UserInfo WHERE USERID LIKE 'ABCDE8%'

  |--Clustered Index Seek(OBJECT:([student].[dbo].[T_UserInfo].[INDEX_Userid]), SEEK:([T_UserInfo].[Userid] >= 'ABCDE8' AND [T_UserInfo].[Userid] < 'ABCDE9'),  WHERE:(like([T_UserInfo].[Userid], 'ABCDE8%', NULL)) ORDERED FORWARD)Ctrl+L看下此時的圖行執行計劃:

Ctrl+L看下此時的圖行執行計劃:

 

 

在有索引的狀況下,咱們再寫一個SQL:

SET SHOWPLAN_ALL ON

SELECT * FROM T_UserInfo WHERE LEFT(USERID,4)='ABCDE8%'

查看StmtText:

SELECT * FROM T_UserInfo WHERE LEFT(USERID,4)='ABCDE8%'

  |--Clustered Index Scan(OBJECT:([student].[dbo].[T_UserInfo].[INDEX_Userid]), WHERE:(substring([T_UserInfo].[Userid], 1, 4)='ABCDE8%'))

Ctrl+L看下此時的圖行執行計劃:

 

 

咱們再分別看一下三種狀況下對IO的操做

分別以下:

第一種狀況:表'T_UserInfo'。掃描計數1,邏輯讀7 次,物理讀0 次,預讀0 次。

第二種狀況:表'T_UserInfo'。掃描計數1,邏輯讀3 次,物理讀0 次,預讀0 次。

第三種狀況:表'T_UserInfo'。掃描計數1,邏輯讀8 次,物理讀0 次,預讀0 次。

這說明:

第一次是表掃描,掃了7頁,也就是全表掃描

第二次是索引掃描,掃了1頁索引,2頁數據頁

第三次是索引掃描+表掃描,掃了1頁索引,7頁數據頁

[圖形界面也有對CPU和IO的消耗,也能夠看出來哪一個最優!] 

 

經過比較,嘿嘿,很容易的看出:第二種第三種寫法在都有索引的狀況下,like有效的使用索引,而left則不能,這樣一個最簡單的優化的例子就出來了,哈哈。

 

  若是以上你都明白了,那麼你可能已經對SQL的優化有初步新的想法了,網上一堆堆的SQL優化的文章真的是那樣嗎?你本身試試就知道了,而沒必要盲目去記那些東西,本身試試,看看MSSQL究竟是怎麼來執行就明白了。

在我舉的例子中,用的是彙集索引掃描,字段是字母加數字,你們能夠試試看純數字的、字母的、漢字的等等,瞭解下MMSQL會如何改變SQL語句來利用索引。而後再試試非彙集索引是什麼狀況?用不用索引和什麼有關?子查詢MSSQL是如何執行?IN用不用索引,LIKE用不用索引?函數用不用索引?OR、AND、UNION?子查詢呢?在這裏我不一一去試給你們看了,只要知道了如何去看MSSQL的執行計劃(圖形和文本),不少事情就很明朗了。

 

大總結:

實現同一查詢功能的SQL寫法可能會有多種,若是判斷哪一種最優化,若是僅僅是從時間上來測,會受不少外界因素的影響,而咱們明白了MSSQL如何去執行,經過IO邏輯讀、經過查看圖示的查詢計劃、經過其優化後而執行的SQL語句,纔是優化SQL的真正途徑。

 

另外提醒下:數據量的多少有時會影響MSSQL對同一種查詢寫法語句的執行計劃,這一點在非彙集索引上特別明顯,還有就是在多CPU與單CPU下,在多用戶併發狀況下,同一寫法的查詢語句執行計劃會有所不一樣,這個就須要你們有機會去試驗了(我也沒有這方面的太多經驗與你們分享)。

 

先寫這些吧,因爲我對MSSQL認識還很淺薄,若有不對的地方,還請指正。

相關文章
相關標籤/搜索