Sql Server之旅——第四站 你必須知道的非彙集索引掃描

  

  非彙集索引,這個是你們都很是熟悉的一個東西,有時候咱們因爲業務緣由,sql寫的很是複雜,須要join不少張表,而後就淚流滿面了。。。這時候就sql

有DBA或者資深的開發給你看這個猥瑣的sql,經過執行計劃一分析。。。或許就看出了不應有的表掃描。。。萬惡之源。。。而後給你在關鍵的字段加上非函數

彙集索引後。。。才發現提速比阿斯頓馬丁還要快。。。那麼一個問題來了,爲何非彙集索引能提速這麼快。。。怎麼作到的???是否是很是的好奇???spa

這篇咱們來解開神祕面紗。code

 

一:現象orm

      先讓咱們一睹非彙集索引的真容,看看到底在執行計劃看來是個什麼玩意。。。我這裏有個product表,裏面灌了8w多數據,而後在Name列上創建blog

一個非彙集索引,就像下圖同樣:索引

  

從上圖中看到了兩個好玩的東西,一個就是我想看到的「索引查找[nonclustered]」,這個你們很熟悉,也是這篇要說的,而後咱們還看到了一個「RID查找」,ip

乍一看這是什麼雞巴玩意。。。非彙集索引跟它扯上什麼關係了???開發

 

二:什麼是RID博客

  經過前面幾篇,我想你們都知道了數據頁中的記錄是如何尋找的?祕密就是經過slot槽位中的偏移量決定的,那問題來了,若是上升到數據頁層面,我

只須要(pageID:slotID)就能夠找到記錄了,對不對?那若是我上升了文件層面,那是否是隻須要知道(fileID:pageID:slotID)就能夠找到數據頁中的 

記錄了?其實這裏的RID就是站在文件的高度經過(fileID:pageID:slotID)找到表記錄的。。。既RID=RowID=(fileID:pageID:slotID),若是你非要眼見

爲實的話,在sq中l還真提供了這麼個函數(sys.fn_PhysLocFormatter(%%physloc%%)),咱們看下圖:

看了上面的圖,是否是很興奮,一目瞭然,好比productID=18088這條記錄,然來是在1號文件,34941號數據頁,0號槽位上,productID=18089

是在1號槽位上,好了,當你知道RID是個什麼東西的時候,我想你已經離完全理解非彙集索引不遠啦。。。

 

三:非彙集索引

  有一點咱們確定知道,就是非彙集索引是能夠加速查找的,要是跟表掃描那樣的龜速,那也就失去了索引的目的,既然能加速,是由於它和彙集索

引同樣,在底層都玩起了B樹,首先咱們插入一些樣例數據。

 1 DROP TABLE dbo.Person
 2 
 3 CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
 4 CREATE  INDEX idx_Person_Name ON dbo.Person(Name)
 5 
 6 DECLARE @ch AS INT=97
 7 
 8 WHILE @ch<=122
 9 BEGIN
10     INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
11     SET @ch=@ch+1
12 END

上面的sql,我故意在Name列設置爲900個char,這也是索引的上限值,這樣的話,我DBCC就能夠導出不少數據頁和索引頁了。

能夠看到,當我dbcc ind 的時候,發現Person表中已經有4個數據頁,5個索引頁,其中151號數據頁是表跟蹤頁,174號爲索引跟蹤頁,這也就

說明當我創建索引後,引擎給咱們分配了專門的索引頁來存放咱們創建的Name索引,那下一步就是咱們來看看這些索引中都存放着什麼,這也是我

很是關心的,接下來我導出173號索引頁。

1 DBCC PAGE(Ctrip,1,173,1)

 1 Slot 0, Offset 0x60, Length 912, DumpStyle BYTE
 2 
 3 Record Type = INDEX_RECORD           Record Attributes =  NULL_BITMAP     Record Size = 912
 4 
 5 Memory Dump @0x000000000EF1C060
 6 
 7 0000000000000000:   16616161 61612020 20202020 20202020 †.aaaaa           
 8 0000000000000010:   20202020 20202020 20202020 20202020 9 0000000000000020:   20202020 20202020 20202020 2020202010 0000000000000030:   20202020 20202020 20202020 2020202011 0000000000000040:   20202020 20202020 20202020 2020202012 0000000000000050:   20202020 20202020 20202020 2020202013 0000000000000060:   20202020 20202020 20202020 2020202014 0000000000000070:   20202020 20202020 20202020 2020202015 0000000000000080:   20202020 20202020 20202020 2020202016 0000000000000090:   20202020 20202020 20202020 2020202017 00000000000000A0:   20202020 20202020 20202020 2020202018 00000000000000B0:   20202020 20202020 20202020 2020202019 00000000000000C0:   20202020 20202020 20202020 2020202020 00000000000000D0:   20202020 20202020 20202020 2020202021 00000000000000E0:   20202020 20202020 20202020 2020202022 00000000000000F0:   20202020 20202020 20202020 2020202023 0000000000000100:   20202020 20202020 20202020 2020202024 0000000000000110:   20202020 20202020 20202020 2020202025 0000000000000120:   20202020 20202020 20202020 2020202026 0000000000000130:   20202020 20202020 20202020 2020202027 0000000000000140:   20202020 20202020 20202020 2020202028 0000000000000150:   20202020 20202020 20202020 2020202029 0000000000000160:   20202020 20202020 20202020 2020202030 0000000000000170:   20202020 20202020 20202020 2020202031 0000000000000180:   20202020 20202020 20202020 2020202032 0000000000000190:   20202020 20202020 20202020 2020202033 00000000000001A0:   20202020 20202020 20202020 2020202034 00000000000001B0:   20202020 20202020 20202020 2020202035 00000000000001C0:   20202020 20202020 20202020 2020202036 00000000000001D0:   20202020 20202020 20202020 2020202037 00000000000001E0:   20202020 20202020 20202020 2020202038 00000000000001F0:   20202020 20202020 20202020 2020202039 0000000000000200:   20202020 20202020 20202020 2020202040 0000000000000210:   20202020 20202020 20202020 2020202041 0000000000000220:   20202020 20202020 20202020 2020202042 0000000000000230:   20202020 20202020 20202020 2020202043 0000000000000240:   20202020 20202020 20202020 2020202044 0000000000000250:   20202020 20202020 20202020 2020202045 0000000000000260:   20202020 20202020 20202020 2020202046 0000000000000270:   20202020 20202020 20202020 2020202047 0000000000000280:   20202020 20202020 20202020 2020202048 0000000000000290:   20202020 20202020 20202020 2020202049 00000000000002A0:   20202020 20202020 20202020 2020202050 00000000000002B0:   20202020 20202020 20202020 2020202051 00000000000002C0:   20202020 20202020 20202020 2020202052 00000000000002D0:   20202020 20202020 20202020 2020202053 00000000000002E0:   20202020 20202020 20202020 2020202054 00000000000002F0:   20202020 20202020 20202020 2020202055 0000000000000300:   20202020 20202020 20202020 2020202056 0000000000000310:   20202020 20202020 20202020 2020202057 0000000000000320:   20202020 20202020 20202020 2020202058 0000000000000330:   20202020 20202020 20202020 2020202059 0000000000000340:   20202020 20202020 20202020 2020202060 0000000000000350:   20202020 20202020 20202020 2020202061 0000000000000360:   20202020 20202020 20202020 2020202062 0000000000000370:   20202020 20202020 20202020 2020202063 0000000000000380:   20202020 20940000 00010000 00020000 †     ........... 
1 Row - Offset                         
2 7 (0x7) - 6480 (0x1950)              
3 6 (0x6) - 5568 (0x15c0)              
4 5 (0x5) - 4656 (0x1230)              
5 4 (0x4) - 3744 (0xea0)               
6 3 (0x3) - 2832 (0xb10)               
7 2 (0x2) - 1920 (0x780)               
8 1 (0x1) - 1008 (0x3f0)               
9 0 (0x0) - 96 (0x60)     

 

從上面至少能夠發現三個有趣的現象:

<1>:173號索引頁中slot0和slot1槽位指向記錄的內容已經有序了,好比:aaaaa,bbbbb。。。。這樣。。。。原來非彙集索引也是有序呀。。。

<2>:6161616161就是16進制的aaaaa。

    9400000001000000 :這幾個數字很是重要,由於是16進製表示,因此2位16進製表示一個字節,因此能夠這麼解釋,前面4個字節表示

    pageID,中間2個字節表示fileID,後面2個字節表示slot,看到這裏你是否是想起了RID。。。由於RID就是這三樣的組合。。。原來非彙集索

   引的記錄存放的就是「key+RowID」呀。。。。

<3>:經過最後的槽位列表,能夠得知173號索引頁上存放着8條索引記錄。

 

  好了,看完了葉子節點,咱們再看分支節點,也就是IndexLevel=1的那條索引數據頁,也就是78號。ok,dbcc看看吧。

當看到這個列表的時候,不知道你腦子裏面是否是有一幅圖出來了,就像上一篇看到彙集索引同樣,由於它的結構和彙集索引很是像,只不過

非彙集索引這裏多了一個RID而已。。。最後我也把圖貢獻一下。

 

總結一下:在走非彙集索引的時候,好比你的條件是where name='jjjjj' 時,它的邏輯是這樣的,根據78號索引數據頁的key的範圍,而後經過

      rowid走到了79號索引數據頁,而後在79號索引數據頁中順利的找到了jjjjj,這時候就能夠拿出jjjjj的rowid去表數據頁中直接定位記錄,

      最後輸出。。。。。這個也就是博客開頭的地方爲何會出現RID的查找。。。

相關文章
相關標籤/搜索