若是沒有索引,掃描的記錄數大於有索引的記錄數sql
索引存放索引列的值(好比id爲索引列,那麼存放索引列的值),和該索引值對應的行在內存中的地址(或者直接存儲該行的數據)數據庫
SELECT * FROM user WHERE username= 'jiajun' ,username創建索引,若是索引採用的數據結構是hash表,那麼這個時候,經過計算jiajun的hash值,O(1)複雜度就能夠找到該記錄的位置數據結構
在等值查找下,此時無hash衝突,這種狀況下,效率是很高的ide
可是在範圍查找下,因爲hash不是有序的,那麼範圍查找下,hash表的優點並不能發揮出來。性能
在hash衝突下,查找效率會降下來優化
磁盤讀取步驟:定柱面,定磁道,定磁塊spa
磁盤時間主要消耗在定位柱面,那麼若是要提升速度,在數據量同樣的狀況下,將盡可能多的數據放在磁盤塊上,那麼這樣能夠減小磁頭定位柱面移動的次數,減小IO的次數。設計
左子樹全部的節點的值小於他的根節點的值orm
右子樹全部的節點的值大於他的根節點的值排序
任意節點的左子樹和右子樹都是二叉查找樹
沒有鍵值相等的節點
二叉查找樹的查找的複雜度到了lgn
可是有沒有辦法減小IO的次數,也就是能不能下降樹的高度
(m階樹 m/2<=k<=m)
根節點至少兩個子節點
全部葉子節點都在同一層
中間節點包含k-1個元素和k個孩子
節點中的元素從小到大排列
每一個節點即包含索引列的值,和該數據記錄(或該數據記錄的值)
相對於二叉查找樹,B樹變得矮胖,由於每一個節點存放的元素更多,因此相同元素狀況下,下降了樹的高度,那麼就能夠減小IO的次數
每一個節點存放了數據(該行記錄的值或者該行記錄在內存的地址),因此不一樣的查詢性能是不同的。
在B-樹的基礎上
除了葉子結點,其餘節點不包含記錄(數據庫中的行)的位置
葉子節點包含了全部的索引值,而且從小到大排列,以及記錄(數據庫中行)的位置
若是節點的大小同樣,那麼若是咱們除了葉節點以外,其餘節點不包含數據,那麼就能夠放更多的元素(索引值),這樣的話這棵樹就變的更加矮胖,那麼IO的次數能夠進一步減小
由於葉節點的元素是順序排列,並且葉節點間造成鏈表,那麼有序查找時提升範圍查詢的效率
相對於B樹,因爲全部的數據是存放在葉節點,那麼意味着每次查找都必須到從根查找到葉節點,那麼這就意味着查詢性能平均。
索引是一種數據,能夠避免了全表查詢,能夠類比目錄和書。
索引須要一種數據結構來存儲
利用散列表(hash)的方式查詢複雜度能夠到O(1),可是再範圍查詢時,hash起不了提升性能的做用
IO操做是耗時,爲了提升查詢性能,能夠減小IO的次數
對於樹的存儲結構來講,爲了提升性能,減小IO的次數,能夠低樹的高度
讀取一個節點一次IO,在數據量同樣的狀況下,若是每一個節點的能存放更多元素,那麼就能夠下降樹的高度。
B樹下降了樹的高度,而在節點大小同樣的狀況下,由於B樹的節點存放了元素有又存放了數據,而B+樹將數據所有存放在葉節點,那麼這樣的話,每一個節點能夠存放更多的元素,那麼就能夠再一次下降樹的高度
B+樹的查詢性能更加穩定,而且更有利於範圍查找
若是是彙集索引(InnoDB引擎),那麼節點存放的該記錄的數據,數據文件自己就是索引文件
若是是非彙集索引(MyISAM引擎),那麼節點存放的是該行記錄的地址。索引文件和數據文件是分離
普通索引,容許出現相同的內容
惟一索引,索引值惟一,容許空值
主鍵索引,建立主鍵的時候自動建立主鍵索引,惟一而且不能爲空
組合索引,多列組合索引
ALTER TABLE table_name ADD INDEX index_name (column_list) 增長普通索引
ALTER TABLE table_name ADD UNIQUE (column_list) 增長惟一索引
ALTER TABLE table_name ADD PRIMARY KEY (column_list) 增長主鍵索引
若是此時爲 username,age,sex建聯合索引
最左匹配指優先匹配最左索引,(username)(username,age)(username,age,sex),只要查詢條件用到最左邊的列,通常就會使用索引。順序能夠不一樣,好比(age,username),這是查詢優化器的功勞。
模糊查詢只有%號不在第一個字符,索引纔可能被使用,好比username like '%jiajun'因此不被採用
若是or中有一個條件沒有索引,sql語句不會用到索引,好比usernmae ='jiajun' or pwd='666',此時索引不被採用
組合索引中,若是查詢條件不是索引的第一列,索引可能不會被採用,好比此時where age =1
若是列是字符型,好比username是字符型並且是索引列,若是此是查詢username=1 ,沒有加引號,那麼這個時候也不會用索引
能夠用 show status like 'Handler_read%' 來查看索引使用狀況。
建議實踐爲主
索引應該設計在where後的列,而不是select後的列
索引應該建在區分度大的列,好比狀態只有1 和2就不必建索引了
對字符串進行索引的時候,應該制定一個前綴長度,好比一個列爲char(200),若是前面幾個字符就要較大區分度,那麼對前幾個字符創建索引就好了,這樣減小了佔用空間,也提升了速度
不要建立太多索引,索引會佔空間,並且更新的時候會下降速度,而且若是有過多的索引,Mysql執行計劃的時候,會考慮各個索引,這也會浪費時間
毫無疑問,在使用正確的狀況下,索引能提升查詢速度
索引也能提升分組和排序的速度
因爲修改刪除添加時,要調維護索引文件,對樹進行調整,因此性能下降了
索引文件也是須要佔用空間的