5.9 數據庫索引及優化

時間 2019-12-01

標籤 5.9 數據庫索引優化欄目 SQL 简体版

原文原文鏈接

分類支持狀況

索引分類

　　普通索引 :

　　　　-index ：加速查找mysql

　　惟一索引

　　　　主鍵索引：primary key ：加速查找+約束（不爲空且惟一）sql

　　　　惟一索引：unique：加速查找+約束（惟一）函數

　　聯合索引

　　　　-primary key(id,name): 聯合主鍵索引大數據

　　　　-unique(id,name): 聯合惟一索引優化

　　　　-index(id,name): 聯合普通索引spa

　　全文索引 fulltext

　　　　用於搜索很長一篇文章的時候，效果最好。unix

　　空間索引 spatial

　　　　瞭解就好，幾乎不用code

類型分類

hash類型索引：

　　　　查詢單條快，範圍查詢慢blog

btree類型索引：

　　　　b+樹，層數越多，數據量指數級增加（咱們就用它，由於innodb默認支持它）排序

引擎支持狀況

InnoDB

　　　　支持事務，支持行級別鎖定，支持 B-tree、Full-text 等索引，不支持 Hash 索引；

MyISAM

　　　　不支持事務，支持表級別鎖定，支持 B-tree、Full-text 等索引，不支持 Hash 索引；

Memory

　　　　不支持事務，支持表級別鎖定，支持 B-tree、Hash 等索引，不支持 Full-text 索引；

NDB

　　　　支持事務，支持行級別鎖定，支持 Hash 索引，不支持 B-tree、Full-text 等索引；

索引使用

建立/刪除索引

#方法一：建立表時
    　　CREATE TABLE 表名 (
                字段名1  數據類型 [完整性約束條件…],
                字段名2  數據類型 [完整性約束條件…],
                [UNIQUE | FULLTEXT | SPATIAL ]   INDEX | KEY
                [索引名]  (字段名[(長度)]  [ASC |DESC]) 
                );


#方法二：CREATE在已存在的表上建立索引
        CREATE  [UNIQUE | FULLTEXT | SPATIAL ]  INDEX  索引名 
                     ON 表名 (字段名[(長度)]  [ASC |DESC]) ;


#方法三：ALTER TABLE在已存在的表上建立索引
        ALTER TABLE 表名 ADD  [UNIQUE | FULLTEXT | SPATIAL ] INDEX
                             索引名 (字段名[(長度)]  [ASC |DESC]) ;
                             

#刪除索引：DROP INDEX 索引名 ON 表名字;

示例

1.建立索引
   
-在建立表時就建立（須要注意的幾點）
    create table s1(
    id int ,　　# 能夠在這加primary key
    # id int index 　　# 不能夠這樣加索引，由於index只是索引，沒有約束一說，
    # 不能像主鍵，還有惟一約束同樣，在定義字段的時候加索引
    name char(20),
    age int,
    email varchar(30)
   
　  #primary key(id) #也能夠在這加
    index(id) #能夠這樣加
    );
    

-在建立表後在建立
    create index name on s1(name);　　 # 添加普通索引
    create unique age on s1(age);　　# 添加惟一索引
    alter table s1 add primary key(id); 　　# 添加住建索引，也就是給id字段增長一個主鍵約束
    create index name on s1(id,name);　　 # 添加普通聯合索引


2.刪除索引
    drop index id on s1;
    drop index name on s1; 　　# 刪除普通索引
    drop index age on s1;　　 # 刪除惟一索引，就和普通索引同樣，不用在index前加unique來刪，直接就能夠刪了
    alter table s1 drop primary key; 　　# 刪除主鍵(由於它添加的時候是按照alter來增長的，那麼咱們也用alter來刪)

正確使用索引的方式

覆蓋索引

select * from s1 where id=123; 　　# * 須要將其餘的全部沒有索引的數據拉取出來，都要一個一個查
select id from s1 where id=123; 　　# id 是有索引的，替換 * 以後直接用索引便可查出，效率很高

聯合索引

select * from s1 where id=123 and name="yangtuo";  # 耗時 0.83s
create index idn on s1(id,name)
select * from s1 where id=123 and name="yangtuo";  # 耗時 0.00s

索引合併

#索引合併：把多個單列索引合併使用

#分析：
組合索引能作到的事情，咱們均可以用索引合併去解決，好比
create index ne on s1(name,email);#組合索引
咱們徹底能夠單獨爲name和email建立索引

組合索引能夠命中：
select * from s1 where name='egon' ;
select * from s1 where name='egon' and email='adf';

索引合併能夠命中：
select * from s1 where name='egon' ;
select * from s1 where email='adf';
select * from s1 where name='egon' and email='adf';

乍一看好像索引合併更好了：能夠命中更多的狀況，但其實要分狀況去看，若是是name='egon' and email='adf',
那麼組合索引的效率要高於索引合併，若是是單條件查，那麼仍是用索引合併比較合理

索引使用規則

#1.最左前綴匹配原則，很是重要的原則，
create index ix_name_email on s1(name,email,)
- 最左前綴匹配：必須按照從左到右的順序匹配
select * from s1 where name='egon'; #能夠
select * from s1 where name='egon' and email='asdf'; #能夠
select * from s1 where email='alex@oldboy.com'; #不能夠
mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就中止匹配，
好比a = 1 and b = 2 and c > 3 and d = 4 若是創建(a,b,c,d)順序的索引，
d是用不到索引的，若是創建(a,b,d,c)的索引則均可以用到，a,b,d的順序能夠任意調整。

#2.=和in能夠亂序，好比a = 1 and b = 2 and c = 3 創建(a,b,c)索引能夠任意順序，mysql的查詢優化器
會幫你優化成索引能夠識別的形式

#3.儘可能選擇區分度高的列做爲索引,區分度的公式是count(distinct col)/count(*)，
表示字段不重複的比例，比例越大咱們掃描的記錄數越少，惟一鍵的區分度是1，而一些狀態、
性別字段可能在大數據面前區分度就是0，那可能有人會問，這個比例有什麼經驗值嗎？使用場景不一樣，
這個值也很難肯定，通常須要join的字段咱們都要求是0.1以上，即平均1條掃描10條記錄

#4.索引列不能參與計算，保持列「乾淨」，好比from_unixtime(create_time) = ’2014-05-29’
就不能使用到索引，緣由很簡單，b+樹中存的都是數據表中的字段值，
但進行檢索時，須要把全部元素都應用函數才能比較，顯然成本太大。
因此語句應該寫成create_time = unix_timestamp(’2014-05-29’);

索引沒法命中的狀況

- like '%xx' 
    select * from tb1 where email like '%cn';
    
    
- 使用函數不走索引
    select * from tb1 where reverse(email) = 'wupeiqi';
    
    
- or 不走索引
    select * from tb1 where nid = 1 or name = 'seven@live.com';
    特別的：當or條件中有未創建索引的列才失效，如下會走索引
            select * from tb1 where nid = 1 or name = 'seven';
            select * from tb1 where nid = 1 or name = 'seven@live.com' and email = 'alex'
            
            
- 類型不一致
    若是列是字符串類型，傳入條件是必須用引號引發來，否則...
    select * from tb1 where email = 999;
    

- !=  不等於不走索引
    select * from tb1 where email != 'alex'
    特別的：若是是主鍵，則仍是會走索引
        select * from tb1 where nid != 123

- >  大於號不走索引
    select * from tb1 where email > 'alex'    
    特別的：若是是主鍵或索引是整數類型，則仍是會走索引
        select * from tb1 where nid > 123
        select * from tb1 where num > 123
        
        
#排序條件爲索引，則select字段必須也是索引字段，不然沒法命中
- order by
    select name from s1 order by email desc;
    當根據索引排序時候，select查詢的字段若是不是索引，則不走索引
    select email from s1 order by email desc;
    特別的：若是對主鍵排序，則仍是走索引：
        select * from tb1 order by nid desc;
 


- 組合索引最左前綴
    若是組合索引爲：(name,email)
    name and email       -- 使用索引
    name                 -- 使用索引
    email                -- 不使用索引


- count(1)或count(列)代替count(*)在mysql中沒有差異了



- create index xxxx  on tb(title(19)) # text類型，必須制定長度

索引使用原則

- 避免使用select *

- count(1)或count(列) 代替 count(*)

- 建立表時儘可能時 char 代替 varchar

- 表的字段順序固定長度的字段優先

- 組合索引代替多個單列索引（常用多個條件查詢時）

- 儘可能使用短索引

- 使用鏈接（JOIN）來代替子查詢(Sub-Queries)

- 連表時注意條件類型需一致

- 索引散列值（重複少）不適合建索引，　　例：性別

慢查詢優化的基本步驟

0.先運行看看是否真的很慢，注意設置SQL_NO_CACHE
1.where條件單表查，鎖定最小返回記錄表。這句話的意思是把查詢語句的where都應用到表中返回的記錄數最小的表開始查起，單表每一個字段分別查詢，看哪一個字段的區分度最高
2.explain查看執行計劃，是否與1預期一致（從鎖定記錄較少的表開始查詢）
3.order by limit 形式的sql語句讓排序的表優先查
4.瞭解業務方使用場景
5.加索引時參照建索引的幾大原則
6.觀察結果，不符合預期繼續從0分析