文章來源:公衆號:猿人谷mysql
通常的應用系統,讀寫比例在10:1左右,並且插入操做和通常的更新操做不多出現性能問題,遇到最多的,也是最容易出問題的,仍是一些複雜的查詢操做,因此查詢語句的優化顯然是重中之重。正則表達式
在數據量和訪問量不大的狀況下,mysql訪問是很是快的,是否加索引對訪問影響不大。可是當數據量和訪問量劇增的時候,就會發現mysql變慢,甚至down掉,這就必需要考慮優化sql了,給數據庫創建正確合理的索引,是mysql優化的一個重要手段。
sql
索引的目的在於提升查詢效率,能夠類比字典,若是要查「mysql」這個單詞,咱們確定須要定位到m字母,而後從上往下找到y字母,再找到剩下的sql。若是沒有索引,那麼你可能須要把全部單詞看一遍才能找到你想要的。除了詞典,生活中隨處可見索引的例子,如火車站的車次表、圖書的目錄等。它們的原理都是同樣的,經過不斷的縮小想要得到數據的範圍來篩選出最終想要的結果,同時把隨機的事件變成順序的事件,也就是咱們老是經過同一種查找方式來鎖定數據。數據庫
在建立索引時,須要考慮哪些列會用於 SQL 查詢,而後爲這些列建立一個或多個索引。事實上,索引也是一種表,保存着主鍵或索引字段,以及一個能將每一個記錄指向實際表的指針。數據庫用戶是看不到索引的,它們只是用來加速查詢的。數據庫搜索引擎使用索引來快速定位記錄。mysql優化
INSERT 與 UPDATE 語句在擁有索引的表中執行會花費更多的時間,而SELECT 語句卻會執行得更快。這是由於,在進行插入或更新時,數據庫也須要插入或更新索引值。函數
索引的類型:性能
舒適提示:根據《阿里巴巴Java開發手冊》裏的mysql規約,惟一索引建議命名爲uk_字段名,普通索引名則爲idx_字段名。(uk即unique key; idx即index的簡稱)。大數據
應用於表建立完畢以後再添加。優化
ALTER TABLE 表名 ADD 索引類型 (unique,primary key,fulltext,index)[索引名](字段名)複製代碼
//普通索引
alter table table_name add index index_name (column_list) ;
//惟一索引
alter table table_name add unique (column_list) ;
//主鍵索引
alter table table_name add primary key (column_list) ;複製代碼
ALTER TABLE可用於建立普通索引、UNIQUE索引和PRIMARY KEY索引3種索引格式,tablename是要增長索引的表名,columnlist指出對哪些列進行索引,多列時各列之間用逗號分隔。索引名index_name**可選**,缺省時,MySQL將根據第一個索引列賦一個名稱。另外,ALTER TABLE容許在單個語句中更改多個表,所以能夠同時建立多個索引。搜索引擎
CREATE INDEX可用於對錶增長普通索引或UNIQUE索引,可用於建表時建立索引。
CREATE INDEX index_name ON table_name(username(length));複製代碼
若是是CHAR,VARCHAR類型,length能夠小於字段實際長度;若是是BLOB和TEXT類型,必須指定 length。
//只能添加這兩種索引;
CREATE INDEX index_name ON table_name (column_list)
CREATE UNIQUE INDEX index_name ON table_name (column_list)複製代碼
tablename、indexname和column_list具備與ALTER TABLE語句中相同的含義,索引名不可選。另外,不能用CREATE INDEX語句建立PRIMARY KEY索引。
刪除索引可使用ALTER TABLE或DROP INDEX語句來實現。DROP INDEX能夠在ALTER TABLE內部做爲一條語句處理,其格式以下:
drop index index_name on table_name ;
alter table table_name drop index index_name ;
alter table table_name drop primary key ;複製代碼
其中,在前面的兩條語句中,都刪除了tablename中的索引indexname。而在最後一條語句中,只在刪除PRIMARY KEY索引中使用,由於一個表只可能有一個PRIMARY KEY索引,所以不須要指定索引名。若是沒有建立PRIMARY KEY索引,但表具備一個或多個UNIQUE索引,則MySQL將刪除第一個UNIQUE索引。
若是從表中刪除某列,則索引會受影響。對於多列組合的索引,若是刪除其中的某列,則該列也會從索引中刪除。若是刪除組成索引的全部列,則整個索引將被刪除。
在這裏要指出,組合索引和前綴索引是對創建索引技巧的一種稱呼,並非索引的類型。爲了更好的表述清楚,創建一個demo表以下。
create table USER_DEMO
(
ID int not null auto_increment comment '主鍵',
LOGIN_NAME varchar(100) not null comment '登陸名',
PASSWORD varchar(100) not null comment '密碼',
CITY varchar(30) not null comment '城市',
AGE int not null comment '年齡',
SEX int not null comment '性別(0:女 1:男)',
primary key (ID)
);複製代碼
爲了進一步榨取mysql的效率,就能夠考慮創建組合索引,即將LOGIN_NAME,CITY,AGE建到一個索引裏:
ALTER TABLE USER_DEMO ADD INDEX name_city_age (LOGIN_NAME(16),CITY,AGE);複製代碼
建表時,LOGIN_NAME長度爲100,這裏用16,是由於通常狀況下名字的長度不會超過16,這樣會加快索引查詢速度,還會減小索引文件的大小,提升INSERT,UPDATE的更新速度。
若是分別給LOGIN_NAME,CITY,AGE創建單列索引,讓該表有3個單列索引,查詢時和組合索引的效率是大不同的,甚至遠遠低於咱們的組合索引。雖然此時有三個索引,但mysql只能用到其中的那個它認爲彷佛是最有效率的單列索引,另外兩個是用不到的,也就是說仍是一個全表掃描的過程。
創建這樣的組合索引,就至關於分別創建以下三種組合索引:
LOGIN_NAME,CITY,AGE
LOGIN_NAME,CITY
LOGIN_NAME複製代碼
爲何沒有CITY,AGE等這樣的組合索引呢?這是由於mysql組合索引「最左前綴"的結果。簡單的理解就是隻從最左邊的開始組合,並非只要包含這三列的查詢都會用到該組合索引。也就是說namecityage(LOGIN_NAME(16),CITY,AGE)從左到右進行索引,若是沒有左前索引,mysql不會執行索引查詢。
若是索引列長度過長,這種列索引時將會產生很大的索引文件,不便於操做,可使用前綴索引方式進行索引,前綴索引應該控制在一個合適的點,控制在0.31黃金值便可(大於這個值就能夠建立)。
SELECT COUNT(DISTINCT(LEFT(`title`,10)))/COUNT(*) FROM Arctic; -- 這個值大於0.31就能夠建立前綴索引,Distinct去重複
ALTER TABLE `user` ADD INDEX `uname`(title(10)); -- 增長前綴索引SQL,將人名的索引創建在10,這樣能夠減小索引文件大小,加快索引查詢速度複製代碼
EXPLAIN能夠幫助開發人員分析SQL問題,explain顯示了mysql如何使用索引來處理select語句以及鏈接表,能夠幫助選擇更好的索引和寫出更優化的查詢語句。
使用方法,在select語句前加上Explain就能夠了:
Explain select * from user where id=1;複製代碼
儘可能避免這些不走索引的sql:
SELECT name,phone FROM `user` WHERE `age`+10=30; -- 不會使用索引,由於全部索引列參與了計算
SELECT name,phone FROM `user` WHERE LEFT(`date`,4) <1990; -- 不會使用索引,由於使用了函數運算,原理與上面相同
SELECT * FROM `user` WHERE `name` LIKE'後盾%' -- 走索引
SELECT * FROM `user` WHERE `name` LIKE "%後盾%" -- 不走索引
-- 正則表達式不使用索引,這應該很好理解,因此爲何在SQL中很難看到regexp關鍵字的緣由
-- 字符串與數字比較不使用索引;
CREATE TABLE `a` (`a` char(10));
EXPLAIN SELECT * FROM `a` WHERE `a`="1" -- 走索引
EXPLAIN SELECT * FROM `a` WHERE `a`=1 -- 不走索引
select * from dept where dname='xxx' or loc='xx' or deptno=45 --若是條件中有or,即便其中有條件帶索引也不會使用。換言之,就是要求使用的全部字段,都必須創建索引, 咱們建議你們儘可能避免使用or 關鍵字
-- 若是mysql估計使用全表掃描要比使用索引快,則不使用索引複製代碼
索引雖然好處不少,但過多的使用索引可能帶來相反的問題,索引也是有缺點的:
索引只是提升效率的一個方式,若是mysql有大數據量的表,就要花時間研究創建最優的索引,或優化查詢語句。
ALTER TABLE USER_DEMO ADD INDEX name_age (NAME,AGE); 複製代碼
由於age會有範圍判斷,則建組合索引時將AGE字段放在後面。複製代碼
如某張表的order_no字段類型爲varchar(50),另外一張表的order_no字段類型爲varchar(50) COLLATE utf8_BIN。則此時聯合查詢時不能走索引的,切記。
即兩張表的字段類型以下:複製代碼
`order_no` varchar(50) COLLATE utf8_bin NOT NULL DEFAULT '' COMMENT '訂單號';
`order_no` varchar(50) NOT NULL DEFAULT '' COMMENT '訂單號';複製代碼
- 表記錄太少
- 常常插入、刪除、修改的表
- 數據重複且分佈平均的表字段。如一個表有10萬行記錄,其中字段column1只有A和B兩種值,且每一個值的分佈機率大約爲50%,那麼對這種表column1字段建索引通常不會提升數據庫的查詢速度。複製代碼
- 無條件查詢若是隻有order by create_time,即使create_time上有索引,也不會使用到。
由於優化器認爲走二級索引再去回表成本比全表掃描排序更高,因此選擇走權標掃描。
- 無條件查詢可是order by create_time limit m,若是m值較小,是能夠走索引的。
由於優化器認爲根據索引有序性去回表查數據,而後獲得m條數據,就能夠終止循環,
那麼成本比全表掃描小,則選擇走二級索引。
即使沒有二級索引,mysql針對order by limit也作了優化,採用堆排序。
- order by排序分爲file sort和index,index的效率更高。但如下狀況不會使用index排序:
- 檢查的行數過多,而且沒有使用覆蓋索引
- 使用了多個索引,mysql一次只會採用一個索引
- where和order by使用了不一樣的索引,與上一條相似
- order by中加入了非索引列,且非索引列不在where中
- 當使用left join,使用右邊的表字段排序複製代碼