筆者將優化分爲了兩大類:軟優化和硬優化。軟優化通常是操做數據庫便可;而硬優化則是操做服務器硬件及參數設置。mysql
首先咱們能夠用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢語句的執行信息。算法
例:sql
DESC SELECT * FROM `user`
其中會顯示索引和查詢數據讀取數據條數等信息。數據庫
在MySQL中,儘可能使用JOIN來代替子查詢。由於子查詢須要嵌套查詢,嵌套查詢時會創建一張臨時表,臨時表的創建和刪除都會有較大的系統開銷,而鏈接查詢不會建立臨時表,所以效率比嵌套子查詢高。緩存
索引是提升數據庫查詢速度最重要的方法之一,使用索引的三大注意事項包括:服務器
LIKE關鍵字匹配'%'開頭的字符串,不會使用索引; OR關鍵字的兩個字段必須都是用了索引,該查詢纔會使用索引; 使用多列索引必須知足最左匹配。
對於字段較多的表,若是某些字段使用頻率較低,此時應當將其分離出來從而造成新的表。架構
對於將大量鏈接查詢的表能夠建立中間表,從而減小在查詢時形成的鏈接耗時。併發
相似於建立中間表,增長冗餘也是爲了減小鏈接查詢。app
分析表主要是分析表中關鍵字的分佈;檢查表主要是檢查表中是否存在錯誤;優化表主要是消除刪除或更新形成的表空間浪費。高併發
分析表: 使用 ANALYZE 關鍵字,如ANALYZE TABLE user
Op: 表示執行的操做;
Msg_type: 信息類型,有status、info、note、warning、error;
Msg_text: 顯示信息。
檢查表: 使用 CHECK關鍵字,如CHECK TABLE user [option]。 option 只對MyISAM有效。共五個參數值:
QUICK: 不掃描行,不檢查錯誤的鏈接;
FAST: 只檢查沒有正確關閉的表;
CHANGED: 只檢查上次檢查後被更改的表和沒被正確關閉的表;
MEDIUM: 掃描行,以驗證被刪除的鏈接是有效的,也能夠計算各行關鍵字校驗和;
EXTENDED: 最全面的的檢查,對每行關鍵字全面查找。
優化表: 使用OPTIMIZE關鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;
LOCAL|NO_WRITE_TO_BINLOG都是表示不寫入日誌,優化表只對VARCHAR、BLOB和TEXT有效,經過OPTIMIZE TABLE語句能夠消除文件碎片,在執行過程當中會加上只讀鎖。
配置多核心和頻率高的cpu,多核心能夠執行多個線程;
配置大內存,提升內存,便可提升緩存區容量,所以能減小磁盤I/O時間,從而提升響應速度;
配置高速磁盤或合理分佈磁盤:高速磁盤提升I/O,分佈磁盤能提升並行操做的能力。
優化數據庫參數能夠提升資源利用率,從而提升MySQL服務器性能。MySQL服務的配置參數都在my.cnf或my.ini,下面列出性能影響較大的幾個參數:
key_buffer_size: 索引緩衝區大小;
table_cache: 能同時打開表的個數;
query_cache_size和query_cache_type: 前者是查詢緩衝區大小,後者是前面參數的開關,0表示不使用緩衝區,1表示使用緩衝區,但能夠在查詢中使用SQL_NO_CACHE表示不要使用緩衝區,2表示在查詢中明確指出使用緩衝區才用緩衝區,即SQL_CACHE;
sort_buffer_size: 排序緩衝區。
由於數據庫壓力過大,首先一個問題就是高峯期系統性能可能會下降,由於數據庫負載太高對性能會有影響。
另一個,壓力過大把你的數據庫給搞掛了怎麼辦?
因此此時你必須得對系統作分庫分表+讀寫分離,也就是把一個庫拆分爲多個庫,部署在多個數據庫服務上,這時做爲主庫承載寫入請求。而後每一個主庫都掛載至少一個從庫,由從庫來承載讀請求。
若是用戶量愈來愈大,此時你能夠不停的加機器,好比說系統層面不停加機器,就能夠承載更高的併發請求。
而後數據庫層面若是寫入併發愈來愈高,就擴容加數據庫服務器,經過分庫分表是能夠支持擴容機器的,若是數據庫層面的讀併發愈來愈高,就擴容加更多的從庫。
可是這裏有一個很大的問題:
數據庫其實自己不是用來承載高併發請求的,因此一般來講,數據庫單機每秒承載的併發就在幾千的數量級,並且數據庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。
若是你就是簡單的不停的加機器,實際上是不對的。
因此在高併發架構裏一般都有緩存這個環節,緩存系統的設計就是爲了承載高併發而生。單機承載的併發量都在每秒幾萬,甚至每秒數十萬,對高併發的承載能力比數據庫系統要高出一到兩個數量級。
你徹底能夠根據系統的業務特性,對那種寫少讀多的請求,引入緩存集羣。
具體來講,就是在寫數據庫的時候同時寫一份數據到緩存集羣裏,而後用緩存集羣來承載大部分的讀請求。這樣的話,經過緩存集羣,就能夠用更少的機器資源承載更高的併發。
==================================================================================================
==================================================================================================
==================================================================================================
優化慢SQL首先得知道瓶頸在哪,本文主要介紹慢SQL性能瓶頸分析。本文就之前段時間參加的一個SQL優化活動爲例。
mysql命令行或者一些可視化工具在sql執行時間的精度比較低,尤爲是命令行只顯示到10ms,因此須要打開mysql的執行時間監聽:
set profiling = 1;
而後使用
show profiles;
命令就可查看sql的執行時間。
例如:
mysql> show profiles; +----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------ -------------------------------------------------------------------------------------------------------------------------------------------+ | Query_ID | Duration | Query | +----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------ -------------------------------------------------------------------------------------------------------------------------------------------+ | 1 | 0.18553425 | select a.seller_id,a.seller_name,b.user_name,c.state from a,b,c where a.seller_name=b.seller_name and b.user_id=c.user_id and c.user_id=17 and a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE) AND DATE_ADD(NOW(), INTERVAL 600 MINUTE) order by a.gmt_create | +----------+------------+------------------------------------------------------------------------------------------------------------------------------------------------ -------------------------------------------------------------------------------------------------------------------------------------------+ 1 row in set, 1 warning (0.00 sec)
在命令行中執行完sql後,使用 show profiles; 語句就可顯示上面的執行歷史信息,找到對應的,能夠看到我剛測試的執行了0.18553425s這個精度就至關高。
接下來咱們使用explain語句分析這條語句在所牽連的表中一共遍歷了多少紀錄
mysql> explain -> select a.seller_id,a.seller_name,b.user_name,c.state from a,b,c -> where a.seller_name=b.seller_name and b.user_id=c.user_id and c.user_id=17 and -> a.gmt_create BETWEEN DATE_ADD(NOW(), INTERVAL - 600 MINUTE) AND DATE_ADD(NOW(), INTERVAL 600 MINUTE) order by a.gmt_create -> ; +----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+ | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra | +----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+ | 1 | SIMPLE | a | NULL | ALL | NULL | NULL | NULL | NULL | 16108 | 11.11 | Using where; Using temporary; Using filesort | | 1 | SIMPLE | b | NULL | ALL | NULL | NULL | NULL | NULL | 16592 | 10.00 | Using where; Using join buffer (Block Nested Loop) | | 1 | SIMPLE | c | NULL | ALL | NULL | NULL | NULL | NULL | 359382 | 1.00 | Using where; Using join buffer (Block Nested Loop) | +----+-------------+-------+------------+------+---------------+------+---------+------+--------+----------+----------------------------------------------------+ 3 rows in set, 1 warning (0.00 sec)
這裏有一個介紹的對這個結果各個列介紹比較好的網頁explain結果介紹
從上面的分析中發現每一個表的數據遍歷了不少(實際上是所有),能夠添加索引進行優化,同時能夠看到a表extra有using temorary就是使用臨時表,這是須要優化的。
這篇文章比較簡單,主要講了mysql的相關使用,等之後再sql優化有了更多的心得必定在總結。
PS
關於join的優化
在沒有分庫分表的時候,join在創建合適的索引後仍是可用的。
關於join的原理 嵌套循環算法,經過join連接的字段通常要創建索義。
看過嵌套循環算法後,其實A left B和B left A在算法複雜度上沒有區別,因此仍是根據業務選擇便可。
同時,嵌套循環的數據並不必定是全表數據,若是where中約束其中一個表,假設是B,這時在循環遍歷B表是遍歷where約束的數據量,因此並非全量對比。
原文連接:https://blog.csdn.net/u013592964/article/details/76154170