MySQL優化 - 性能分析與查詢優化

    優化應貫穿整個產品開發週期中,好比編寫複雜SQL時查看執行計劃,安裝MySQL服務器時儘可能合理配置(見過太多徹底使用默認配置安裝的狀況),根據應用負載選擇合理的硬件配置等。html

 

一、性能分析

 性能分析包含多方面:CPU、Memory、磁盤/網絡IO、MySQL服務器自己等。mysql

1.1 操做系統分析ios

常規的操做系統分析,在Linux中一般包含一些性能監控命令,如top、vmstat、iostat、strace、iptraf等。sql

一、內存:內存是大項,高查詢消耗大量的查詢緩存,內存必須足夠,而且給系統自己要預留一些。緩存

二、磁盤:配備高速磁盤+RAID會有更好的讀寫速度,而且SSD成本逐漸下降,升級成本會在可接受範圍。性能優化

三、網絡:目前市場上千兆萬兆網卡已很常見。服務器

四、CPU:雖然不少狀況下CPU用不完,但也不能讓它成爲瓶頸。網絡

生產環境的MySQL多數狀況部署在Linux系統中,Linux系統自己能夠優化的配置並很少。硬件的選型是複雜,涉及計算機組成的原理性知識,須要額外瞭解。函數

 

1.2 MySQL服務性能分析工具

MySQL服務器的性能一般經過監控命令查看系統工做狀態,肯定哪些因素成爲瓶頸。

1.2.1  SHOW GLOBAL STATUS

顯示了目前MySQL的工做狀態,包含不少參數,下面對一些參數進行說明,其他的參考官方說明:

====================================

1. Aborted_clients
若是該值隨時間增長,檢查是否優雅關閉鏈接,檢查max_allowed_packet配置變量是否被超過致使強制中斷。

2. Aborted_connections
接近於0,檢查網絡問題,若是有少許是正常的,好比鑑權失敗等。

3. Binlog_cache_disk_use和Binlog_cache_use
大部分事務應該在緩衝中進行,若是disk cache很大,可考慮增長內存緩存。

4. Bytes_recevied和Bytes_sent
若是值很大,檢查是否查詢超過須要的數據。

5. Com_*
儘可能讓如Com_rollback這些不常見的變量超過預期,用innotop檢查。

6. Create_tmp_tables
優化查詢下降該值。

7. Handler_read_rnd_next
Handler_read_rnd_next / Handler_read_rnd顯示全表掃面大體平均值,若是很大,只能優化查詢。

8. Open_files
不該該接近於open_files_limit,若是接近就應該適當增長open_files_limit。

9. Qcache_*
查詢緩存相關。

10. Select_full_join
全聯接無索引聯接,儘可能避免,優化查詢。

11. Select_full_range_join
值太高說明使用了範圍查詢聯接表,範圍查詢比較慢,可優化。

12. Sort_meger_passes
若是值較大可考慮增長sort_buffer_size,查明是那個查詢致使使用文件排序。

13. Table_locks_waited
表被鎖定致使服務器鎖等待,InnoDB的行鎖不會使得該變量增長,建議開啓慢查詢日誌。

14. Threads_created
若是值在增長,可考慮增長thread_cache_size。

====================================

 

1.2.2  SHOW ENGINE INNODB STATUS

暫時的數據包含了太多InnoDB核心信息,而且須要比較深的瞭解InnoDB引擎工做原理,這裏不作過多說明,請查閱針對此的專項文檔。

注: 一般包含SEMAPHORES、TRANSACTIONS、FILE I/O、LOG、BUFFER POOL AND MEMORY等一些詳細值,有些參數是上一次執行以來的平均值,因此建議隔一段時間再打印一次獲得這段時間的統計,有點相似iostat的統計磁盤平均讀寫同樣。

 

1.2.3  開啓慢查詢日誌配置

排查致使MySQL運行緩慢的問題SQL,開啓慢查詢日誌配置,可能有頗有幫助:

slow_query_log=1
slow_query_log_file=/YOUR_DIR/mysql_slow.log

配合慢查詢日誌分析工具(如mysqlsla)

 

 

二、查詢性能優化

    通常來講在編寫SQL時,注意查詢是否能使用到索引,是否在大表中或者高頻率查詢中引發全表掃描,這些主要經過經驗分析配合execution plan獲得比較理想的查詢消耗。

 

2.1 查詢基礎

瞭解查詢過程,才能知道哪些步驟可能出現瓶頸,execution plan結果也會有所體現,MySQL查詢的通常過程:

1. Client往服務器發送查詢指令。
2. 服務器查詢緩存,若是存在則直接返回,不然下一步。
3. 服務器解析、預處理和優化查詢,生成執行計劃。
4. 執行引擎調用存儲引擎API執行查詢。
5. 服務器將結果返回至客戶端。

用圖表示以下:

 

解析與預處理過程:

- 解析器將查詢分解後構造解析樹,進行語法解析與驗證查詢,檢查SQL是否有效。

- 預處理器解析語義:如檢查表和列是否存在,是否存在歧義等。

- 預處理器檢查權限。

查詢優化器:

該過程比較複雜,將解析樹的結果變成執行計劃,優化器的任務是尋找最好的方式(但並非總能選擇最好的方案),MySQL使用基於開銷的優化器,預測不一樣執行計劃的開銷。

- MySQL不考慮不受它控制的開銷,如用戶存儲過程與用戶自定義的函數

- 不考慮正在運行的其餘查詢

 

2.2 優化數據訪問 (這一點很重要)

1. 應用程序是否獲取超過須要的數據量?(PS: 屢次遇到過查詢表全部數據而後再程序中只讀取10行之類的代碼)

2. MySQL 服務器是否分析了超過須要的行?數據是否沒有在存儲引擎層被過來掉?(Using index , Using where)

 

典型的錯誤以下:

1. 提取超過須要的行,而後在程序中只要一部分 (應該使用limit限制數據量)。

2. 多表join提取全部的列 (應該只讀取須要的列)。

3. 提取全部的列(提取不須要的列可能致使優化索引失效,增長磁盤IO,浪費內存等, 但若是是知道這個影響並利用查詢緩存,簡化設計等也是能夠考慮的)。

 

訪問類型:

Full Table Scan > Index Scan > Range Scan > Unique Index Lookup > Constant.

訪問速度以此遞增。

對於使用where語句來過濾數據的話,最好到最壞的狀況是:

1. 對索引查找用where來消除不匹配的數據行,在存儲引擎層。

2. 使用覆蓋索引 (Extra 爲Using Index) 來避免訪問行,取得索引數據後過濾行,發生在MySQL服務器層,但不須要讀取行數據。

3. 從表中查詢數據,而後過濾 (Using Where), 發生在服務器端而且要讀取行數據。

後面會針對執行計劃結果作詳細介紹。

 

 

2.3 關於執行計劃

執行計劃結果樣例以下圖(也可用其餘的可視化工具,如mysql workbench):

 

所表明的含義可在官方文檔中找到詳細說明 ( https://dev.mysql.com/doc/refman/5.5/en/explain-output.html ),

這裏說明一些比較重要的結果:

TYPE字段的值:

前面所說的訪問速度依次遞增就和這個有關:

Full Table Scan > Index Scan > Range Scan > Unique Index Lookup > Constant.

這裏列出一些常見的說明:

一、const:  最多匹配一行, 如 SELECT * FROM rental where rental_id=1。

二、eq_ref: 讀取的行依次匹配前一個表。

三、ref: 鏈接僅使用左索引或者索引不是PRIMARY或UNIQUE(或者說獲得的不是一行的結果),若是獲得的幾行數據,這是個比較好的類型。

四、range:  使用索引的範圍掃描,如使用了 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()等條件。

五、index: 除了索引樹被掃描以外,索引鏈接類型與ALL相同。這有兩種方式:

**************

1. 若是索引是查詢的覆蓋索引,並知足表中所需的全部數據,則僅掃描索引樹。 在這種狀況下,Extra列爲Using index。 僅索引掃描一般比ALL更快,由於索引的大小一般小於表數據。

2. 使用索引來執行全表掃描,以按索引順序查找數據行。 在Extra列張則沒有Using index,這種狀況與ALL的區別是ALL是按行掃描。

**************

六、ALL: 全表掃描,比較糟糕 (但有時候數據比較少的狀況下,MySQL會直接進行全表掃描讀取數據,效率更高)。

 

 

2.4 優化特定的查詢

    查詢優化的一個辦法是遷移舊數據,騰出內存空間從新平衡索引結構,使得更快的查詢速度,不少應用保留半年或三個月的數據都能知足需求,對於舊數據,額外提供平臺訪問或者在應用層作路由。

2.4.1 優化COUNT (遇到過只知其一;不知其二的使用,致使想優化卻拔苗助長)

COUNT有兩種不一樣的工做方式:統計值的數量和統計行的數量。

值是一個非空(Non-NULL)的表達式(NULL則表示沒有值),若是在COUNT()中定義了列名或其餘表達式,COUNT則會統計這個表達式有值(Non-NULL)的次數。

COUNT另一種工做方式就是統計行數,當MySQL知道括號中的表達式不會爲NULL的時候,則使用這種方式,COUNT(*)是個例子,它不會展開成全部列,則是忽略因此的列並統計。

 

2.4.2 優化limit和offset

偏移量很大的查詢代價很高,如LIMIT 10000, 10, 則會產生10010數據,而後只截取10行。解決辦法:

1. 限制分頁能讀取的數據頁數。

2. 可考慮使用覆蓋索引,如 select id, name, description from book limit 100,10;

在ID上有索引改進爲:select id, name, description from book  inner join (select id from book limit 100, 10) as b;

相關文章
相關標籤/搜索