Sql Server 索引

索引用於快速找出在某個列中有某一特定值的行,不使用索引,數據庫必須從第一條記錄開始讀完整個表,直到找出相關的行。表越大,查詢數據所花費的時間越多,若是表中查詢的列有一個索引,數據庫能快速到達一個位置去搜索數據,本篇主要介紹與索引相關的內容,包括索引的含義和特色,索引的分類,索引的設計原則以及如何建立和刪除索引。html

一:索引的含義和特色

 索引是一個單獨的,存儲在磁盤上的數據結構,它們包含則對數據表裏全部記錄的引用指針,使用索引用於快速找出在某個或多個列中有某一特定值的行,對相關列使用索引是下降查詢操做時間的最佳途徑。索引包含由表或視圖中的一列或多列生成的鍵。面試

 例如:數據庫中有20000條記錄,如今要執行這樣一個查詢:SELECT * FROM tableName WHERE num=10000。若是沒有索引,必須遍歷整個表,直到num=10000的這一行爲止;若是在num列上建立索引,SQL Server不須要任何掃描,直接在索引裏面找10000,就能夠得知這一行的位置。可見,索引的創建能夠加快數據的查詢速度。數據庫

索引的優勢主要有如下幾條:數據結構

 (1).經過建立惟一索引,能夠保證數據庫表的每一行數據的惟一性。架構

 (2).能夠大大加快數據的查詢速度,這也是建立索引的最主要的緣由。函數

 (3).實現數據的參照完整性,能夠速表和表之間的鏈接。工具

 (4).在使用分組和排序子句進行查詢時,也能夠顯著減小查詢中分組和排序的時間。性能

同時,增長索引也有不利的一面:優化

 (1).建立索引和維護索引要耗費時間,而且隨着數據量的增長所耗費的時間也會增長。spa

 (2).索引須要佔磁盤空間,除了數據表佔數據空間以外,每個索引還要佔必定的物理空間,若是有大量的索引,索引文件可能比數據文件更快達到作大文件尺寸。

 (3).當對錶中的數據進行增長,刪除和修改的時候,索引也要動態地維護,這樣就就下降了數據的維護速度。

 
二:索引的分類

 不一樣數據庫中提供了不一樣的索引類型,SQL Server中的索引有兩種:彙集索引和非彙集索引。它們的區別是在物理數據的存儲方式上。

1.彙集索引 

  彙集索引基於數據行的鍵值,在表內排序和存儲這些數據行。每一個表只能有一個彙集索引,由於數據行自己只能按一個順序存儲。

 (1).每一個表只能有一個彙集索引;

 (2). 表中的物理順序和索引中行的物理順序是相同的,建立任何非彙集索引以前要首先建立彙集索引,這是由於非彙集索引改變了表中行的物理順序;

 (3).關鍵值的惟一性使用UNIQUE關鍵字或者由內部的惟一標識符明確維護。

 (4).在索引的建立過程當中,SQL Server臨時使用當前數據庫的磁盤空間,因此要保證有足夠的空間建立索引。

2.非彙集索引

 非彙集索引具備徹底獨立於數據行的結構,使用非彙集索引不用將物理數據頁中的數據按列排序,非彙集索引包含索引鍵值和指向表數據存儲位置的行定位器。

 能夠對錶或索引視圖建立多個非彙集索引。一般,設計非彙集索引是爲了改善常用的、沒有創建彙集索引的查詢的性能。

 查詢優化器在搜索數據值時,先搜索非彙集索引以找到數據值在表中的位置,而後直接從該位置檢索數據。這使得非彙集索引成爲徹底匹配查詢的最佳選擇,由於索引中包含搜索的數據值在表中的精確位置的項。

 具備如下特色的查詢能夠考慮使用非彙集索引:

  (1).使用JOIN或者GROUP BY子句,應爲鏈接和分組操做中所涉及的列建立多個非彙集索引,爲任何外鍵建立一個彙集索引.

  (2).包含大量惟一值的字段。

  (3).不返回大型結果集的查詢。建立篩選索引以覆蓋從大型表中返回定義完善的的行子集的查詢。

  (4).常常包含在查詢的搜索條件(如返回徹底匹配的WHERE子句)中的列。

3.其它索引

 除了彙集索引和非彙集索引以外,SQL Server中還提供了其它的索引類型。 

惟一索引:確保索引鍵不包含重複的值,所以,表或視圖中的每一行在某種程度上是惟一的。彙集索引和非彙集索引均可以是惟一索引。這種惟一性和主鍵約束是關聯的,在某種程度上,主鍵約束等於惟一性的彙集索引。

包含列索引:一種非彙集索引,它擴展後不只包含鍵列,還包含非堅列。

索引視圖:在視圖上添加索引後能提升視圖的查詢效率。視圖的索引將具體化視圖,並將結果集永久存儲在惟一的彙集索引中,並且存儲方式相同,建立彙集索引後,能夠爲視圖添加非彙集索引。

全文索引:一種特殊類型的基於標記的功能索引,由SQL Server全文引擎生成和維護,用於幫助在字符串數據中搜索複雜的詞,這種索引的結構與數據庫引擎使用的彙集索引或非彙集索引的B樹結構是不一樣的。

空間索引:一種針對geometry數據類型的列上創建的索引,這樣能夠更高效的列中的空間對象執行某些操做,空間索引能夠減小須要應用開銷相對較大的空間操做的對象數。

篩選索引:一種通過優化的的非彙集索引,尤爲適用於涵蓋從定義完善的數據子集中選擇數據的查詢。篩選索引使用篩選謂詞對錶中的的部分進行索引,與全表索引相比,設計良好的篩選索引能夠提升查詢性能,減小索引維護開銷並可下降索引存儲開銷

XML索引:是與XML數據關聯的索引形式,是XML二進制大對象(BLOB)的已拆分持久表示形式,XML索引能夠分爲主索引和輔助索引。

 

三:索引的設計原則

 索引設計不合理或者缺乏索引都會對數據庫和應用程序的性能形成障礙,高效的索引對於得到良好的性能很是重要。設計索引時,應該考慮如下原則:

 (1).索引並不是越多越好,一個表中若是有大量的索引,不只佔用大量的磁盤空間,並且會影響INSERT、DELETE、UPDATE等語句的性能。由於當表中數據更改的同時,索引也會進行調整和更新。

 (2).避免對常常更新的表進行過多的索引,而且索引中的列儘量少。而對常常用於查詢的字段應該建立索引,但要避免添加沒必要要的字段。

 (3).數據量小的表最好不要使用索引,因爲數據較少,查詢花費的時間可能比遍歷索引的時間還要短,索引可能不會產生優化效果。

 (4).在條件表達式中常常用到的、不一樣值較多的列上創建索引,在不一樣值較少的列上不要創建索引、好比在學生表的【性別】

字段上只有【男】或【女】兩個不一樣值,所以就無需創建索引,若是創建索引,不但不會提升查詢效率,反而會嚴重下降更新速度。 

  (5).當惟一性是某種數據自己的特徵時,指定惟一索引,使用惟一索引可以確保定義的列的數據完整性,提升查詢速度。

 (6).在頻繁進行排序或分組(即進行GROUP BY 或ORDER BY操做)的列上創建索引,若是待排序的列有多個,能夠在這些列上創建組合索引。

 

四:建立索引

 在瞭解了不一樣索引類型後,下面開始介紹如何使用T_SQL建立索引:

  CREATE INDEX命令既能夠建立一個改變表的物理順序的彙集索引,也能夠建立提升查詢性能的非彙集索引。語法以下:

  CREATE [UNIQUE] [CLUSTERED   |    NONCLUSTERRED]

  INDEX index_name ON {table | view }(column [ASC | DESC ]  [,...n])

  [ INCLUDE ( column_name [ ,...n])]

  [with

   (

    PAD_INDEX={ON | OFF}

    | FILLFACTOR =fillfactor

    | SORT_IN_TEMPDB={ ON | OFF}

    |  IGNORE_DUP_KEY ={ ON  | OFF}

    |  STATISRICS_NORECOMPUTE ={ ON | OFF}

    |   DROP_EXISTING = { ON | OFF}

    |  ONLINE ={ ON | OFF}

    |  ALLOW_ROW_LOCKS ={ ON | OFF}

    |  ALLOW_PAGE_LOCKS={ ON   | OFF}

    |  MAXDOP =max_degree_of_parallelism     

   ) [,...n] ]

UNIQUE:表示在表或視圖上建立惟一索引。惟一索引不容許兩行具備相同的索引鍵值。視圖的彙集索引必須惟一。

CLUSTERED:表示建立彙集索引,在建立任何非彙集索引以前建立彙集索引,建立彙集索引時會從新生成表中現有的非彙集索引。若是沒有指定CLUSTERED,則建立非彙集索引。

NONCLUSTERED:表示建立一個非彙集索引,非彙集索引數據行的物理順序獨立於與索引排序,每一個表最多可包含999個非彙集索引,NONCLUSTERED是CREATE INDEX的默認值。

index_name:指定索引的名稱,索引名稱在表或視圖中必須惟一,但在數據庫中可沒必要惟一。

ON{table | view }:指定索引所屬的表或視圖。

Column:指定索引基於一列或者多列。指定兩個或者多個列名,可爲指定的列的組合值建立組合索引,{table | view}後的括號中,按排序優先級列出組合索引要包括的列。一個組合索引鍵中最多可組合16列。組合索引鍵中的全部列必須在同一個表或視圖中。

[ASC | DESC]:指定索引列的升序或降序排序方向,默認爲ASC。

INCLUDE(column[,...n]):指定要添加到非彙集索引的葉級別的非鍵列。

PAD_INDEX:表示指定索引填充,默認值爲OFF。ON值表示fillfactor指定的可用空間百分比應用於索引的中間級頁。

FILLFACTOR=fillfactor:制定一個百分比,表示在索引建立或從新生成過程當中數據庫引擎應使每一個索引頁的葉級別達到的填充程度。fillfactor必須爲介於1至100直接的整數值,默認值爲0;

SORT_IN_TESTDB:指定是否在tempdb中存儲臨時排序結果,默認值爲OFF,ON值表示在tempdb中存儲用於生成索引的中間排序結果,OFF表示中間排序結果與索引存儲在同一數據庫中。

IGNORE_DUP_KEY:指定惟一彙集索引或惟一非彙集索引執行多行插入操做時,出現重複鍵值的錯誤響應。默認值爲OFF。ON表示發出一跳警告消息,但只有違反了惟一索引的行纔會失敗,OFF表示發出錯誤消息,並回滾整個INSERT事物。

STATISRICS_NORECOMPUTE:指定是否從新計算分發統計信息,默認值爲OFF。ON表示不會自動從新計算過期的統計信息,OFF表示啓用統計信息自動更新功能。

DROP_EXISTING:指定刪除並從新生成已命名的先前存在的彙集或非彙集索引。默認值爲OFF。ON表示刪除並從新生成現有索引。指定的索引名稱必須與當前現有的索引相同,但能夠修改索引定義,例如:能夠指定不一樣的列,排序順序,分區方案或索引選項。OFF表示若是指定的索引名已存在,則會顯示一條錯誤。

ONLINE={ON | OFF}:指定在索引操做期間,基礎表和關聯的索引是否用於查詢和數據修改操縱,默認值爲OFF。

ALLOW_ROW_LOCKS:指定是否容許行鎖,默認值爲ON,ON表示在訪問索引時容許行所。數據庫引擎肯定什麼時候使用行鎖。OFF表示未使用行鎖。

ALLOW_PAGE_LOCKS:指定是否容許頁鎖,默認值爲ON,ON表示在訪問索引時容許頁鎖。數據庫引擎肯定什麼時候使用頁鎖。OFF表示未使用頁鎖。

MAXDOP:指定在索引操做期間,覆蓋【最大並行度】配置選項,使用MAXDOP能夠限制在執行並行計劃的過程當中使用的處理器數量,最大數量爲64.

【例1】在teacher表中的t_phone列上,建立一個名稱爲Idx_phone的惟一彙集索引,降序排列,填充因子爲30%,輸入語句以下:

 CREATE UNIQUE  CLOSTERED INDEX Idx_phone

 ON  teacher (t_phone  DESC)

 WITH

 FILLFACTOR=30;

【例2】 --在teacher表中的t_name和t_gender列上,建立一個名稱爲Idx_nameAndgender的-惟一非彙集組合索引,升序排列,填充因子爲10%。以下:

--首先建立teacher表

   CREATE TABLE teacher(

     t_id int IDENTITY(1,1) PRIMARY KEY ,

     t_name varchar(20),

     t_phone varchar(11),

     t_gender char(2)

   )

--建立索引

CREATE UNIQUE NONCLUSTERED INDEX Idx_nameAndgender

ON teacher(t_name,t_gender)

WITH

FILLFACTOR=10;

注意:若是teacher表中定義了主鍵,則不能執行【例1】中的腳本,由於每一個表只能有一個彙集索引,數據行自己只能按一個順序存儲。而且主鍵自己就是一個彙集索引。

五:管理和維護索引

 索引建立後能夠根據須要對數據庫中的索引進行管理,例如在數據表中進行增長,刪除或者更新操做,會使索引頁出現碎塊,爲了提升系統的性能,必須對索引進行維護管理,這些管理包括顯示索引信息、索引的性能分析和維護,以及刪除索引等。

1.顯示索引信息

 (1).用系統存儲過程查看索引信息

   系統存儲過程sp_helpindex能夠返回某個表或視圖中的索引信息,語法以下:

   sp_helpindex [@objectname= ]  'name';

   [@objectname=] 'name':用戶定義的表或視圖的限定或非限定名稱。僅當指定限定的表或視圖名稱時,才須要使用引號。若是提供了徹底限定的名稱,包括數據庫名稱,則該數據庫名稱必須是當前數據庫的名稱。

 【例】使用存儲過程查看是 sample_db數據庫中teacher表中定義的索引信息,輸入語句以下。

  USE  sample_db;

  GO

  exec sp_helpindex 'teacher';

 由執行結果能夠看到,這裏顯示了authors表中的索引信息:

 index_name:指定索引名稱.

 index_description:包含索引的描述信息,例如惟一性索引,彙集索引等。

 index_keys:包含了索引所在表中的列.

(2).查看索引的統計信息

 索引信息還包括統計信息,這些信息能夠用來分析索引性能,更好的維護索引,索引統計信息是查詢優化器用來分析和評估查詢、制定最優查詢方式的基礎數據,用戶能夠用圖形界面化工具來查看索引信息,也可使用DBCC SHOW_STATISTICS命令來查看索引的信息。

【例】使用DBCC SHOW_STATISTICS命令來查看teacher表中Idx_phone索引的統計信息,以下:

  DBCC SHOW_STATISTICS ('sample_db.dbo.teacher',Idx_phone);

  返回的統計信息包括三個部分:統計標題信息,統計密度信息和統計直方信息。統計標題信息主要包括表中的行數,統計抽樣行數,索引列的平均長度等。統計密度信息主要包括索引列前綴集選擇性,平均長度等信息,統計直方圖信息即爲顯示直方圖時的信息。

(3).重命名索引

 系統存儲過程sp_rename能夠用於更改索引的名稱,其語法以下:

 sp_rename 'object_name','new_name' 'object_type'

object_name:用戶對象或數據類型的當前限定或非限定名稱。此對象能夠是表,索引,列,別名數據庫類型或用戶定義類型。

new_name:指定對象的新名稱;

object_type:指定修改的對象類型。下表列出了對象類型的取值:

               sp_rename函數可重命名的對象

 【例】將teacher表中的索引名稱idx_nameAndgender更改成multi_index,輸入以下:

USE  sample_db;

GO

exec sp_rename  'teacher.idx_nameAndgender' ,'multi_index', index;

(4)刪除索引

 當再也不須要某個索引時,能夠將其刪除,DROP INDEX命令能夠刪除一個或者多個當前數據庫中的索引,語法以下:

DROP INDEX '[table | view ].index' [,...n]

或者

DROP INDEX ' index'  ON '[table | view ].index' 

[table | view ]:用於指定索引列所在的表或視圖;

index:用於指定要刪除的索引名稱。

注意:DROP INDEX 命令不能刪除由 CREATE TABLE或者ALTER TABLE命令建立的主鍵(PRIMARY KEY)或者惟一性(UNIQUE)約束索引,也不能刪除系統表重的索引。

【例】刪除表teacher中的索引 multi_index,以下:

USE  sample_db;

GO

exec sp_helpindex 'teacher'

DROP INDEX teacher.multi_index

exec sp_helpindex 'teacher';

LZ在一次面試中遇到的面試題:

1.索引對數據庫性能如此重要,應該如何使用它?

答:爲數據庫選擇正確的索引是一項複雜的任務,若是索引較少,則須要的磁盤空間和維護開銷都較少,若是在一個大表上建立了多種組合索引,索引文件會膨脹的很快,而另外一方面,索引較多則可覆蓋更多的查詢,可能須要試驗若干不一樣的設計,才能找到最有效的索引,能夠添加、修改和刪除索引而不影響數據庫架構或應用程序設計。所以,應該嘗試多個不一樣的索引,從而創建最優的索引。

2.爲何要使用短索引?

答:對字符類型的字段進行索引,若是可能應該指定一個前綴長度;例如:若是有一個varchar(255)的列,若是在前10個或者30個字符內,多數值是惟一的,則不須要對整個列進行索引。短索引不只能夠提升查詢速度並且能夠節省磁盤空間和減小I/O操做。

 以上例子的總體代碼:

--索引
--建立teacher表
create database sample_db;
CREATE TABLE teacher(
    t_id int IDENTITY(1,1),
    t_name varchar(20),
    t_phone varchar(11),
    t_gender char(2)
)
--【例1】在teacher表中的t_phone列上,建立一個名稱爲Idx_phone的惟一彙集索引,
--降序排列,填充因子爲30%,輸入語句以下:
CREATE UNIQUE  NONCLUSTERED INDEX Idx_phone
ON  teacher (t_phone  DESC)
WITH
FILLFACTOR=30;
--【例2】在teacher表中的t_name和t_gender列上,建立一個名稱爲Idx_nameAndgender的
--惟一非彙集組合索引,升序排列,填充因子爲10%。以下:
CREATE UNIQUE NONCLUSTERED INDEX Idx_nameAndgender
ON teacher(t_name,t_gender)
WITH
FILLFACTOR=10;
--用系統存儲過程查看索引信息
USE  sample_db;
GO
exec sp_helpindex 'teacher';
--查看索引統計信息
DBCC SHOW_STATISTICS ('sample_db.dbo.teacher',Idx_phone);
--【例】將teacher表中的索引名稱Idx_nameAndgender更改成multi_index,
--輸入以下:
USE  sample_db;
GO
exec sp_rename  'teacher.Idx_nameAndgender' ,'multi_index', 'index';
--【例】刪除表teacher中的索引 multi_index,以下:
USE  sample_db;
GO
exec sp_helpindex 'teacher'
DROP INDEX teacher.multi_index
exec sp_helpindex 'teacher';
相關文章
相關標籤/搜索