select * from doc where title like '%XX'; --不能使用索引 select * from doc where title like 'XX%'; --非前導模糊查詢,可使用索引
由於頁面搜索嚴禁左模糊或者全模糊,若是須要可使用搜索引擎來解決。java
1.union
可以命中索引,而且MySQL 耗費的 CPU 最少。mysql
select * from doc where status=1 union all select * from doc where status=2;
2.in
可以命中索引,查詢優化耗費的 CPU 比 union all
多,但能夠忽略不計,通常狀況下建議使用 in
。程序員
select * from doc where status in (1, 2);
3.or
新版的 MySQL 可以命中索引,查詢優化耗費的 CPU 比 in
多,不建議頻繁用or
。sql
select * from doc where status = 1 or status = 2
4.補充:有些地方說在where
條件中使用or
,索引會失效,形成全表掃描,這是個誤區:數據庫
①要求where
子句使用的全部字段,都必須創建索引;性能優化
②若是數據量太少,mysql制定執行計劃時發現全表掃描比索引查找更快,因此會不使用索引;app
③確保mysql版本5.0
以上,且查詢優化器開啓了index_merge_union=on
, 也就是變量optimizer_switch
裏存在index_merge_union
且爲on
。數據庫設計
負向條件有:!=
、<>
、not in
、not exists
、not like
等。ide
例以下面SQL語句:函數
select * from doc where status != 1 and status != 2;
能夠優化爲 in 查詢:
select * from doc where status in (0,3,4);
若是在(a,b,c)
三個字段上創建聯合索引,那麼他會自動創建 a
| (a,b)
| (a,b,c)
組索引。
登陸業務需求,SQL語句以下:
select uid, login_time from user where login_name=? andpasswd=?
能夠創建(login_name, passwd)
的聯合索引。由於業務上幾乎沒有passwd
的單條件查詢需求,而有不少login_name
的單條件查詢需求,因此能夠創建(login_name, passwd)
的聯合索引,而不是(passwd, login_name
)。
1.創建聯合索引的時候,區分度最高的字段在最左邊
2.存在非等號和等號混合判斷條件時,在創建索引時,把等號條件的列前置。如where a>? and b=?
,那麼即便a
的區分度更高,也必須把b
放在索引的最前列。
3.最左前綴查詢時,並非指SQL語句的where順序要和聯合索引一致。
下面的 SQL 語句也能夠命中 (login_name, passwd)
這個聯合索引:
select uid, login_time from user where passwd=? andlogin_name=?
但仍是建議 where
後的順序和聯合索引一致,養成好習慣。
4.假如index(a,b,c)
,where a=3 and b like 'abc%' and c=4
,a
能用,b
能用,c
不能用。
範圍條件有:<、<=、>、>=、between
等。
索引最多用於一個範圍列,若是查詢條件中有兩個範圍列則沒法全用到索引。
假若有聯合索引 (empno、title、fromdate)
,那麼下面的 SQL 中 emp_no
能夠用到索引,而title
和 from_date
則使用不到索引。
select * from employees.titles where emp_no < 10010' and title='Senior Engineer'and from_date between '1986-01-01' and '1986-12-31'
例以下面的 SQL 語句,即便 date
上創建了索引,也會全表掃描:
select * from doc where YEAR(create_time) <= '2016';
可優化爲值計算,以下:
select * from doc where create_time <= '2016-01-01';
好比下面的 SQL 語句:
select * from order where date < = CURDATE();
能夠優化爲:
select * from order where date < = '2018-01-2412:00:00';
字符串類型不加單引號會致使索引失效,由於mysql會本身作類型轉換,至關於在索引列上進行了操做。
若是 phone
字段是 varchar
類型,則下面的 SQL 不能命中索引。
select * from user where phone=13800001234
能夠優化爲:
select * from user where phone='13800001234';
更新會變動 B+ 樹,更新頻繁的字段創建索引會大大下降數據庫性能。
「性別」這種區分度不大的屬性,創建索引是沒有什麼意義的,不能有效過濾數據,性能與全表掃描相似。
通常區分度在80%以上的時候就能夠創建索引,區分度可使用 count(distinct(列名))/count(*)
來計算。
覆蓋索引:查詢的列和所創建的索引的列個數相同,字段相同。
被查詢的列,數據能從索引中取得,而不用經過行定位符 row-locator 再到 row 上獲取,即「被查詢列要被所建的索引覆蓋」,這可以加速查詢速度。
例如登陸業務需求,SQL語句以下。
Select uid, login_time from user where login_name=? and passwd=?
能夠創建(login_name, passwd, login_time)
的聯合索引,因爲 login_time
已經創建在索引中了,被查詢的 uid
和 login_time
就不用去 row
上獲取數據了,從而加速查詢。
只要列中包含有NULL值都將不會被包含在索引中,複合索引中只要有一列含有NULL
值,那麼這一列對於此複合索引就是無效的。因此咱們在數據庫設計時,儘可能使用not null
約束以及默認值。
1.order by
最後的字段是組合索引的一部分,而且放在索引組合順序的最後,避免出現file_sort 的狀況,影響查詢性能。
例如對於語句 where a=? and b=? order by c
,能夠創建聯合索引(a,b,c)
。
2.若是索引中有範圍查找,那麼索引有序性沒法利用,如WHERE a>10 ORDER BY b;
,索引(a,b)
沒法排序。
對列進行索引,若是可能應該指定一個前綴長度。例如,若是有一個CHAR(255)
的列,若是該列在前10
個或20
個字符內,能夠作到既使得前綴索引的區分度接近全列索引,那麼就不要對整個列進行索引。由於短索引不只能夠提升查詢速度並且能夠節省磁盤空間和I/O操做,減小索引文件的維護開銷。可使用count(distinct leftIndex(列名, 索引長度))/count(*)
來計算前綴索引的區分度。
但缺點是不能用於 ORDER BY
和 GROUP BY
操做,也不能用於覆蓋索引。
不過不少時候不必對全字段創建索引,根據實際文本區分度決定索引長度便可。
MySQL 並非跳過 offset
行,而是取 offset+N
行,而後返回放棄前 offset 行,返回 N 行,那當 offset 特別大的時候,效率就很是的低下,要麼控制返回的總頁數,要麼對超過特定閾值的頁數進行 SQL 改寫。
示例以下,先快速定位須要獲取的id
段,而後再關聯:
selecta.* from 表1 a,(select id from 表1 where 條件 limit100000,20 ) b where a.id=b.id;
好比以下 SQL 語句:
select * from user where login_name=?;
能夠優化爲:
select * from user where login_name=? limit 1
本身明確知道只有一條結果,但數據庫並不知道,明確告訴它,讓它主動中止遊標移動。
須要 join 的字段,數據類型必須一致,多表關聯查詢時,保證被關聯的字段須要有索引。
例如:left join
是由左邊決定的,左邊的數據必定都有,因此右邊是咱們的關鍵點,創建索引要建右邊的。固然若是索引在左邊,能夠用right join
。
consts
:單表中最多隻有一個匹配行(主鍵或者惟一索引),在優化階段便可讀取到數據。
ref
:使用普通的索引(Normal Index)
。
range
:對索引進行範圍檢索。
當 type=index
時,索引物理文件全掃,速度很是慢。
不要覺得惟一索引影響了 insert
速度,這個速度損耗能夠忽略,但提升查找速度是明顯的。另外,即便在應用層作了很是完善的校驗控制,只要沒有惟一索引,根據墨菲定律,必然有髒數據產生。
索引越多越好,認爲須要一個查詢就建一個索引。
寧缺勿濫,認爲索引會消耗空間、嚴重拖慢更新和新增速度。
抵制唯一索引,認爲業務的唯一性一概須要在應用層經過「先查後插」方式解決。
過早優化,在不瞭解系統的狀況下就開始優化。
既然索引能夠加快查詢速度,那麼是否是隻要是查詢語句須要,就建上索引?答案是否認的。由於索引雖然加快了查詢速度,但索引也是有代價的:索引文件自己要消耗存儲空間,同時索引會加劇插入、刪除和修改記錄時的負擔,另外,MySQL在運行時也要消耗資源維護索引,所以索引並非越多越好。通常兩種狀況下不建議建索引。
第一種狀況是表記錄比較少,例如一兩千條甚至只有幾百條記錄的表,不必建索引,讓查詢作全表掃描就行了。至於多少條記錄纔算多,這個我的有我的的見解,我我的的經驗是以2000做爲分界線,記錄數不超過 2000能夠考慮不建索引,超過2000條能夠酌情考慮索引。
另外一種不建議建索引的狀況是索引的選擇性較低。所謂索引的選擇性(Selectivity),是指不重複的索引值(也叫基數,Cardinality)與表記錄數(#T)的比值:
Index Selectivity = Cardinality / #T
顯然選擇性的取值範圍爲(0, 1]``,選擇性越高的索引價值越大,這是由
B+Tree的性質決定的。例如,
employees.titles表,若是
title`字段常常被單獨查詢,是否須要建索引,咱們看一下它的選擇性:
SELECT count(DISTINCT(title))/count(*) AS Selectivity FROM employees.titles; +-------------+ | Selectivity | +-------------+ | 0.0000 | +-------------+
title
的選擇性不足0.0001
(精確值爲0.00001579),因此實在沒有什麼必要爲其單獨建索引。
有一種與索引選擇性有關的索引優化策略叫作前綴索引,就是用列的前綴代替整個列做爲索引key,當前綴長度合適時,能夠作到既使得前綴索引的選擇性接近全列索引,同時由於索引key變短而減小了索引文件的大小和維護開銷。下面以employees.employees
表爲例介紹前綴索引的選擇和使用。
假設employees表只有一個索引<emp_no>,那麼若是咱們想按名字搜索一我的,就只能全表掃描了:
EXPLAIN SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido'; +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+ | 1 | SIMPLE | employees | ALL | NULL | NULL | NULL | NULL | 300024 | Using where | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+
若是頻繁按名字搜索員工,這樣顯然效率很低,所以咱們能夠考慮建索引。有兩種選擇,建<first_name>
或<first_name, last_name>
,看下兩個索引的選擇性:
SELECT count(DISTINCT(first_name))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.0042 | +-------------+ SELECT count(DISTINCT(concat(first_name, last_name)))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.9313 | +-------------+
<first_name>
顯然選擇性過低,``<first_name, last_name>選擇性很好,可是
first_name和
last_name加起來長度爲
30,有沒有兼顧長度和選擇性的辦法?能夠考慮用first_name和last_name的前幾個字符創建索引,例如
<first_name, left(last_name, 3)>`,看看其選擇性:
SELECT count(DISTINCT(concat(first_name, left(last_name, 3))))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.7879 | +-------------+
選擇性還不錯,但離0.9313仍是有點距離,那麼把last_name前綴加到4:
SELECT count(DISTINCT(concat(first_name, left(last_name, 4))))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.9007 | +-------------+
這時選擇性已經很理想了,而這個索引的長度只有18
,比<first_name, last_name>
短了接近一半,咱們把這個前綴索引建上:
ALTER TABLE employees.employees ADD INDEX `first_name_last_name4` (first_name, last_name(4));
此時再執行一遍按名字查詢,比較分析一下與建索引前的結果:
SHOW PROFILES; +----------+------------+---------------------------------------------------------------------------------+ | Query_ID | Duration | Query | +----------+------------+---------------------------------------------------------------------------------+ | 87 | 0.11941700 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | | 90 | 0.00092400 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | +----------+------------+---------------------------------------------------------------------------------+
性能的提高是顯著的,查詢速度提升了120多倍。
前綴索引兼顧索引大小和查詢速度,可是其缺點是不能用於ORDER BY
和GROUP BY
操做,也不能用於Covering index
(即當索引自己包含查詢所需所有數據時,再也不訪問數據文件自己)。
感謝你們看到這裏,文章有不足,歡迎你們指出;若是你以爲寫得不錯,那就給我一個贊吧。
也歡迎你們關注個人公衆號:程序員麥冬,麥冬天天都會分享java相關技術文章或行業資訊,歡迎你們關注和轉發文章!