索引原理及幾種索引類型區別

        在關係數據庫中,索引是一種單獨的、物理的對數據庫表中的一列或多列的值進行排序的一種存儲結構, 它是某個表中一列或若干列值的集合和相應的指向表中物理標識這些值的數據頁的邏輯 指針清單。索引的做用至關於圖書的目錄,能夠根據目錄中的 頁碼快速找到所需的內容。
        索引提供只想存儲在表的指定列中的數據值的指針,而後根據指定的排序順序對這些指針排序,數據庫使用索引以找到特定值,而後根據指針找到包含該值的行,這樣可使對應於表的sql語句執行的更快,可快速訪問數據表中的特定信息。
 
索引的原理
先提出幾個問題:
  • 爲何要給表加上主鍵?
  • 爲何加索引後會使查詢變快?
  • 爲何加索引後會使寫入、修改、刪除變慢?
  • 什麼狀況下要同時在兩個字段上建索引?
接下里一一解決:
 
        咱們平時建表的時候都會爲表加上主鍵, 在某些關係數據庫中, 若是建表時不指定主鍵,數據庫會拒絕建表的語句執行。 事實上, 一個加了主鍵的表,並不能被稱之爲「表」。一個沒加主鍵的表,它的數據無序的放置在磁盤存儲器上,一行一行的排列的很整齊, 跟我認知中的「表」很接近。若是給表上了主鍵,那麼表在磁盤上的存儲結構就由整齊排列的結構轉變成了樹狀結構,也就是上面說的「平衡樹」結構,換句話說,就是整個表就變成了一個索引。沒錯, 再說一遍, 整個表變成了一個索引,也就是所謂的「彙集索引」。 這就是爲何一個表只能有一個主鍵, 一個表只能有一個「彙集索引」,由於主鍵的做用就是把「表」的數據格式轉換成「索引(平衡樹)」的格式放置。
 
主鍵必定是惟一性索引
 
        假如一張表有一億條數據 ,須要查找其中某一條數據,按照常規邏輯, 一條一條的去匹配的話, 最壞的狀況下須要匹配一億次才能獲得結果,用大O標記法就是O(n)最壞時間複雜度,這是沒法接受的,
並且這一億條數據顯然不能一次性讀入內存供程序使用, 所以, 這一億次匹配在不經緩存優化的狀況下就是一億次IO開銷,以如今磁盤的IO能力和CPU的運算能力, 有可能須要幾個月才能得出結果 。
若是把這張錶轉換成平衡樹結構(一棵很是茂盛和節點很是多的樹),假設這棵樹有10層,那麼只須要10次IO開銷就能查找到所須要的數據, 速度以指數級別提高,用大O標記法就是O(log n),n是記錄總樹,底數是樹的分叉數,
結果就是樹的層次數。換言之,查找次數是以樹的分叉數爲底,記錄總數的對數,用程序來表示就是Math.Log(100000000,10),100000000是記錄數,10是樹的分叉數(真實環境下分叉數遠不止10), 結果就是查找次數,
這裏的結果從億降到了個位數。所以,利用索引會使數據庫查詢有驚人的性能提高。
        然而, 事物都是有兩面的, 索引能讓數據庫查詢數據的速度上升, 而使寫入數據的速度降低,緣由很簡單的, 由於平衡樹這個結構必須一直維持在一個正確的狀態, 增刪改數據都會改變平衡樹各節點中的索引數據內容,破壞樹結構, 
所以,在每次數據改變時, DBMS必須去從新梳理樹(索引)的結構以確保它的正確,這會帶來不小的性能開銷,也就是爲何索引會給查詢之外的操做帶來反作用的緣由。
    
以上是彙集索引的內容,接下來看一下非彙集索引也就是常規索引
非彙集索引跟彙集索引同樣,一樣是採用平衡樹所謂索引的數據結構,
非彙集索引和彙集索引的區別在於, 經過彙集索引能夠查到須要查找的數據, 而經過非彙集索引能夠查到記錄對應的主鍵值 , 再使用主鍵的值經過彙集索引查找到須要的數據,以下圖:
無論經過任何方式、索引查詢表,最終都是利用主鍵經過彙集索引來定位到數據。
 
 
 

 

1、簡介

 

MySQL目前主要有如下幾種索引類型:
1.普通索引
2.惟一索引
3.主鍵索引
4.組合索引
5.全文索引

2、語句

CREATE TABLE table_name[col_name data type][unique|fulltext][index|key][index_name](col_name[length])[asc|desc]

 

1.unique|fulltext爲可選參數,分別表示惟一索引、全文索引
2.index和key爲同義詞,二者做用相同,用來指定建立索引
3.col_name爲須要建立索引的字段列,該列必須從數據表中該定義的多個列中選擇
4.index_name指定索引的名稱,爲可選參數,若是不指定,默認col_name爲索引值
5.length爲可選參數,表示索引的長度,只有字符串類型的字段才能指定索引長度
6.asc或desc指定升序或降序的索引值存儲

3、索引類型

 

1.普通索引
是最基本的索引,它沒有任何限制。它有如下幾種建立方式:
(1)直接建立索引
CREATE INDEX index_name ON table(column(length))
(2)修改表結構的方式添加索引
ALTER TABLE table_name ADD INDEX index_name ON (column(length))
(3)建立表的時候同時建立索引
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER NOT NULL ,
`content` text CHARACTER NULL ,
`time` int(10) NULL DEFAULT NULL ,
PRIMARY KEY (`id`),
INDEX index_name (title(length))
)
(4)刪除索引
DROP INDEX index_name ON table

 

2.惟一索引
與前面的普通索引相似,不一樣的就是:索引列的值必須惟一,但容許有空值。若是是組合索引,則列值的組合必須惟一。它有如下幾種建立方式:
(1)建立惟一索引
CREATE UNIQUE INDEX indexName ON table(column(length))
(2)修改表結構
ALTER TABLE table_name ADD UNIQUE indexName ON (column(length))
(3)建立表的時候直接指定
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER NOT NULL ,
`content` text CHARACTER NULL ,
`time` int(10) NULL DEFAULT NULL ,
UNIQUE indexName (title(length))
);

 

3.主鍵索引
是一種特殊的惟一索引,一個表只能有一個主鍵,不容許有空值。通常是在建表的時候同時建立主鍵索引:
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) NOT NULL ,
PRIMARY KEY (`id`)
);

 

4.組合索引
指多個字段上建立的索引,只有在查詢條件中使用了建立索引時的第一個字段,索引纔會被使用。使用組合索引時遵循最左前綴集合
ALTER TABLE `table` ADD INDEX name_city_age (name,city,age);

 

5.全文索引
主要用來查找文本中的關鍵字,而不是直接與索引中的值相比較。fulltext索引跟其它索引大不相同,它更像是一個搜索引擎,而不是簡單的where語句的參數匹配。fulltext索引配合match against操做使用,而不是通常的where語句加like。它能夠在create table,alter table ,create index使用,不過目前只有char、varchar,text 列上能夠建立全文索引。值得一提的是,在數據量較大時候,現將數據放入一個沒有全局索引的表中,而後再用CREATE index建立fulltext索引,要比先爲一張表創建fulltext而後再將數據寫入的速度快不少。
(1)建立表的適合添加全文索引
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER NOT NULL ,
`content` text CHARACTER NULL ,
`time` int(10) NULL DEFAULT NULL ,
PRIMARY KEY (`id`),
FULLTEXT (content)
);
(2)修改表結構添加全文索引
ALTER TABLE article ADD FULLTEXT index_content(content)
(3)直接建立索引
CREATE FULLTEXT INDEX index_content ON article(content)

4、缺點

 

1.雖然索引大大提升了查詢速度,同時卻會下降更新表的速度,如對錶進行insert、update和delete。由於更新表時,不只要保存數據,還要保存一下索引文件。
2.創建索引會佔用磁盤空間的索引文件。通常狀況這個問題不太嚴重,但若是你在一個大表上建立了多種組合索引,索引文件的會增加很快。
索引只是提升效率的一個因素,若是有大數據量的表,就須要花時間研究創建最優秀的索引,或優化查詢語句。

5、注意事項

 

使用索引時,有如下一些技巧和注意事項:
1.索引不會包含有null值的列
只要列中包含有null值都將不會被包含在索引中,複合索引中只要有一列含有null值,那麼這一列對於此複合索引就是無效的。因此咱們在數據庫設計時不要讓字段的默認值爲null。
2.使用短索引
對串列進行索引,若是可能應該指定一個前綴長度。例如,若是有一個char(255)的列,若是在前10個或20個字符內,多數值是唯一的,那麼就不要對整個列進行索引。短索引不只能夠提升查詢速度並且能夠節省磁盤空間和I/O操做。
3.索引列排序
查詢只使用一個索引,所以若是where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。所以數據庫默認排序能夠符合要求的狀況下不要使用排序操做;儘可能不要包含多個列的排序,若是須要最好給這些列建立複合索引。
4.like語句操做
通常狀況下不推薦使用like操做,若是非使用不可,如何使用也是一個問題。like 「%aaa%」 不會使用索引而like 「aaa%」可使用索引。
5.不要在列上進行運算
這將致使索引失效而進行全表掃描,例如
SELECT * FROM table_name WHERE YEAR(column_name)<2017;
6.不使用not in和<>操做
相關文章
相關標籤/搜索