SQL優化-如何分析性能瓶頸

MySQL優化一覽圖

 

 

 

 

筆者將優化分爲了兩大類:軟優化和硬優化。軟優化通常是操做數據庫便可;而硬優化則是操做服務器硬件及參數設置。mysql

一、軟優化

1)查詢語句優化

首先咱們能夠用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢語句的執行信息。算法

例:sql

DESC SELECT * FROM `user`

其中會顯示索引和查詢數據讀取數據條數等信息。數據庫

2)優化子查詢

在MySQL中,儘可能使用JOIN來代替子查詢。由於子查詢須要嵌套查詢,嵌套查詢時會創建一張臨時表,臨時表的創建和刪除都會有較大的系統開銷,而鏈接查詢不會建立臨時表,所以效率比嵌套子查詢高。緩存

3)使用索引

索引是提升數據庫查詢速度最重要的方法之一,使用索引的三大注意事項包括:服務器

LIKE關鍵字匹配'%'開頭的字符串,不會使用索引;
OR關鍵字的兩個字段必須都是用了索引,該查詢纔會使用索引;
使用多列索引必須知足最左匹配。

4)分解表

對於字段較多的表,若是某些字段使用頻率較低,此時應當將其分離出來從而造成新的表。架構

5)中間表

對於將大量鏈接查詢的表能夠建立中間表,從而減小在查詢時形成的鏈接耗時。併發

6)增長冗餘字段

相似於建立中間表,增長冗餘也是爲了減小鏈接查詢。app

7)分析表、檢查表、優化表

分析表主要是分析表中關鍵字的分佈;檢查表主要是檢查表中是否存在錯誤;優化表主要是消除刪除或更新形成的表空間浪費。高併發

分析表: 使用 ANALYZE 關鍵字,如ANALYZE TABLE user

Op: 表示執行的操做;
Msg_type: 信息類型,有status、info、note、warning、error;
Msg_text: 顯示信息。

檢查表: 使用 CHECK關鍵字,如CHECK TABLE user [option]。 option 只對MyISAM有效。共五個參數值:

QUICK: 不掃描行,不檢查錯誤的鏈接;
FAST: 只檢查沒有正確關閉的表;
CHANGED: 只檢查上次檢查後被更改的表和沒被正確關閉的表;
MEDIUM: 掃描行,以驗證被刪除的鏈接是有效的,也能夠計算各行關鍵字校驗和;
EXTENDED: 最全面的的檢查,對每行關鍵字全面查找。
優化表: 使用OPTIMIZE關鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;

LOCAL|NO_WRITE_TO_BINLOG都是表示不寫入日誌,優化表只對VARCHAR、BLOB和TEXT有效,經過OPTIMIZE TABLE語句能夠消除文件碎片,在執行過程當中會加上只讀鎖。

二、硬優化

1)硬件三件套

配置多核心和頻率高的cpu,多核心能夠執行多個線程;
配置大內存,提升內存,便可提升緩存區容量,所以能減小磁盤I/O時間,從而提升響應速度;
配置高速磁盤或合理分佈磁盤:高速磁盤提升I/O,分佈磁盤能提升並行操做的能力。

2)優化數據庫參數

優化數據庫參數能夠提升資源利用率,從而提升MySQL服務器性能。MySQL服務的配置參數都在my.cnf或my.ini,下面列出性能影響較大的幾個參數:

key_buffer_size: 索引緩衝區大小;
table_cache: 能同時打開表的個數;
query_cache_size和query_cache_type: 前者是查詢緩衝區大小,後者是前面參數的開關,0表示不使用緩衝區,1表示使用緩衝區,但能夠在查詢中使用SQL_NO_CACHE表示不要使用緩衝區,2表示在查詢中明確指出使用緩衝區才用緩衝區,即SQL_CACHE;
sort_buffer_size: 排序緩衝區。

3)分庫分表

由於數據庫壓力過大,首先一個問題就是高峯期系統性能可能會下降,由於數據庫負載太高對性能會有影響。

另一個,壓力過大把你的數據庫給搞掛了怎麼辦?

因此此時你必須得對系統作分庫分表+讀寫分離,也就是把一個庫拆分爲多個庫,部署在多個數據庫服務上,這時做爲主庫承載寫入請求。而後每一個主庫都掛載至少一個從庫,由從庫來承載讀請求。

4)緩存集羣

若是用戶量愈來愈大,此時你能夠不停的加機器,好比說系統層面不停加機器,就能夠承載更高的併發請求。

而後數據庫層面若是寫入併發愈來愈高,就擴容加數據庫服務器,經過分庫分表是能夠支持擴容機器的,若是數據庫層面的讀併發愈來愈高,就擴容加更多的從庫。

可是這裏有一個很大的問題:

數據庫其實自己不是用來承載高併發請求的,因此一般來講,數據庫單機每秒承載的併發就在幾千的數量級,並且數據庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。

若是你就是簡單的不停的加機器,實際上是不對的。

因此在高併發架構裏一般都有緩存這個環節,緩存系統的設計就是爲了承載高併發而生。單機承載的併發量都在每秒幾萬,甚至每秒數十萬,對高併發的承載能力比數據庫系統要高出一到兩個數量級。

你徹底能夠根據系統的業務特性,對那種寫少讀多的請求,引入緩存集羣。

具體來講,就是在寫數據庫的時候同時寫一份數據到緩存集羣裏,而後用緩存集羣來承載大部分的讀請求。這樣的話,經過緩存集羣,就能夠用更少的機器資源承載更高的併發。

 

 

 

 

 

==================================================================================================

==================================================================================================

==================================================================================================

MySQL慢SQL優化-如何分析性能瓶頸

優化慢SQL首先得知道瓶頸在哪,本文主要介紹慢SQL性能瓶頸分析。本文就之前段時間參加的一個SQL優化活動爲例。
mysql命令行或者一些可視化工具在sql執行時間的精度比較低,尤爲是命令行只顯示到10ms,因此須要打開mysql的執行時間監聽:

set profiling = 1;

而後使用

show profiles;

命令就可查看sql的執行時間。

例如:

mysql> show profiles;
+----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------------------------------------------------+
| Query_ID | Duration   | Query
                                                                                                                                           |
+----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------------------------------------------------+
|        1 | 0.18553425 | select a.seller_id,a.seller_name,b.user_name,c.state   from  a,b,c
where  a.seller_name=b.seller_name  and    b.user_id=c.user_id   and  c.user_id=17  and
a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE) AND  DATE_ADD(NOW(), INTERVAL 600 MINUTE)  order  by  a.gmt_create |
+----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set, 1 warning (0.00 sec)

在命令行中執行完sql後,使用 show profiles; 語句就可顯示上面的執行歷史信息,找到對應的,能夠看到我剛測試的執行了0.18553425s這個精度就至關高。
接下來咱們使用explain語句分析這條語句在所牽連的表中一共遍歷了多少紀錄

mysql> explain
    -> select a.seller_id,a.seller_name,b.user_name,c.state   from  a,b,c
    -> where  a.seller_name=b.seller_name  and    b.user_id=c.user_id   and  c.user_id=17  and
    -> a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE) AND  DATE_ADD(NOW(), INTERVAL 600 MINUTE)  order  by  a.gmt_create
    -> ;
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra                                              |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
|  1 | SIMPLE      | a     | NULL       | ALL  | NULL          | NULL | NULL    | NULL |  16108 |    11.11 | Using where; Using temporary; Using filesort       |
|  1 | SIMPLE      | b     | NULL       | ALL  | NULL          | NULL | NULL    | NULL |  16592 |    10.00 | Using where; Using join buffer (Block Nested Loop) |
|  1 | SIMPLE      | c     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 359382 |     1.00 | Using where; Using join buffer (Block Nested Loop) |
+----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+
3 rows in set, 1 warning (0.00 sec)

這裏有一個介紹的對這個結果各個列介紹比較好的網頁explain結果介紹

從上面的分析中發現每一個表的數據遍歷了不少(實際上是所有),能夠添加索引進行優化同時能夠看到a表extra有using temorary就是使用臨時表,這是須要優化的。

這篇文章比較簡單,主要講了mysql的相關使用,等之後再sql優化有了更多的心得必定在總結。

PS
關於join的優化
在沒有分庫分表的時候,join在創建合適的索引後仍是可用的。
關於join的原理 嵌套循環算法,經過join連接的字段通常要創建索義。

看過嵌套循環算法後,其實A left B和B left A在算法複雜度上沒有區別,因此仍是根據業務選擇便可。
同時,嵌套循環的數據並不必定是全表數據,若是where中約束其中一個表,假設是B,這時在循環遍歷B表是遍歷where約束的數據量,因此並非全量對比。

 

 

 


原文連接:https://blog.csdn.net/u013592964/article/details/76154170

原文地址:https://www.toutiao.com/a6733466794163454472/?timestamp=1569375599&app=news_article_lite&group_id=6733466794163454472&req_id=201909250939590100260790161ABB2A15

相關文章
相關標籤/搜索