MySQL數據庫優化分析

前言

數據庫優化一方面是找出系統的瓶頸,提升MySQL數據庫的總體性能,而另外一方面須要合理的結構設計和參數調整,以提升用戶的相應速度,同時還要儘量的節約系統資源,以便讓系統提供更大的負荷.數據庫

1. 優化一覽圖

clipboard.png

優化分爲了兩大類,軟優化和硬優化,軟優化通常是操做數據庫便可,而硬優化則是操做服務器硬件及參數設置.
緩存

2. 軟優化

2.1 查詢語句優化

1.首先咱們能夠用EXPLAIN或DESCRIBE(簡寫:DESC)命令分析一條查詢語句的執行信息.
2.例:bash

DESC SELECT * FROM `user`複製代碼

顯示:
clipboard.png服務器

其中會顯示索引和查詢數據讀取數據條數等信息.架構

2.2 優化子查詢

在MySQL中,儘可能使用JOIN來代替子查詢.由於子查詢須要嵌套查詢,嵌套查詢時會創建一張臨時表,臨時表的創建和刪除都會有較大的系統開銷,而鏈接查詢不會建立臨時表,所以效率比嵌套子查詢高.併發

2.3 使用索引

索引是提升數據庫查詢速度最重要的方法之一,關於索引能夠參高筆者<MySQL數據庫索引>一文,介紹比較詳細,此處記錄使用索引的三大注意事項:高併發

  1. LIKE關鍵字匹配'%'開頭的字符串,不會使用索引.
  2. OR關鍵字的兩個字段必須都是用了索引,該查詢纔會使用索引.
  3. 使用多列索引必須知足最左匹配.

2.4 分解表

對於字段較多的表,若是某些字段使用頻率較低,此時應當,將其分離出來從而造成新的表,性能

2.5 中間表

對於將大量鏈接查詢的表能夠建立中間表,從而減小在查詢時形成的鏈接耗時.優化

2.6 增長冗餘字段

相似於建立中間表,增長冗餘也是爲了減小鏈接查詢.spa

2.7 分析表,,檢查表,優化表

分析表主要是分析表中關鍵字的分佈,檢查表主要是檢查表中是否存在錯誤,優化表主要是消除刪除或更新形成的表空間浪費.

1. 分析表: 使用 ANALYZE 關鍵字,如ANALYZE TABLE user;

clipboard.png

  1. Op:表示執行的操做.
  2. Msg_type:信息類型,有status,info,note,warning,error.
  3. Msg_text:顯示信息.
2. 檢查表: 使用 CHECK關鍵字,如CHECK TABLE user [option]

option 只對MyISAM有效,共五個參數值:

  1. QUICK:不掃描行,不檢查錯誤的鏈接.
  2. FAST:只檢查沒有正確關閉的表.
  3. CHANGED:只檢查上次檢查後被更改的表和沒被正確關閉的表.
  4. MEDIUM:掃描行,以驗證被刪除的鏈接是有效的,也能夠計算各行關鍵字校驗和.
  5. EXTENDED:最全面的的檢查,對每行關鍵字全面查找.
3. 優化表:使用OPTIMIZE關鍵字,如OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE user;

LOCAL|NO_WRITE_TO_BINLOG都是表示不寫入日誌.,優化表只對VARCHAR,BLOB和TEXT有效,經過OPTIMIZE TABLE語句能夠消除文件碎片,在執行過程當中會加上只讀鎖.

3. 硬優化

3.1 硬件三件套

1.配置多核心和頻率高的cpu,多核心能夠執行多個線程.
2.配置大內存,提升內存,便可提升緩存區容量,所以能減小磁盤I/O時間,從而提升響應速度.
3.配置高速磁盤或合理分佈磁盤:高速磁盤提升I/O,分佈磁盤能提升並行操做的能力.

3.2 優化數據庫參數

優化數據庫參數能夠提升資源利用率,從而提升MySQL服務器性能.MySQL服務的配置參數都在my.cnf或my.ini,下面列出性能影響較大的幾個參數.

  • key_buffer_size:索引緩衝區大小
  • table_cache:能同時打開表的個數
  • query_cache_size和query_cache_type:前者是查詢緩衝區大小,後者是前面參數的開關,0表示不使用緩衝區,1表示使用緩衝區,但能夠在查詢中使用SQL_NO_CACHE表示不要使用緩衝區,2表示在查詢中明確指出使用緩衝區才用緩衝區,即SQL_CACHE.
  • sort_buffer_size:排序緩衝區

3.3 分庫分表

由於數據庫壓力過大,首先一個問題就是高峯期系統性能可能會下降,由於數據庫負載太高對性能會有影響。另一個,壓力過大把你的數據庫給搞掛了怎麼辦?因此此時你必須得對系統作分庫分表 + 讀寫分離,也就是把一個庫拆分爲多個庫,部署在多個數據庫服務上,這時做爲主庫承載寫入請求。而後每一個主庫都掛載至少一個從庫,由從庫來承載讀請求。
clipboard.png

3.4 緩存集羣

若是用戶量愈來愈大,此時你能夠不停的加機器,好比說系統層面不停加機器,就能夠承載更高的併發請求。而後數據庫層面若是寫入併發愈來愈高,就擴容加數據庫服務器,經過分庫分表是能夠支持擴容機器的,若是數據庫層面的讀併發愈來愈高,就擴容加更多的從庫。可是這裏有一個很大的問題:數據庫其實自己不是用來承載高併發請求的,因此一般來講,數據庫單機每秒承載的併發就在幾千的數量級,並且數據庫使用的機器都是比較高配置,比較昂貴的機器,成本很高。若是你就是簡單的不停的加機器,實際上是不對的。因此在高併發架構裏一般都有緩存這個環節,緩存系統的設計就是爲了承載高併發而生。因此單機承載的併發量都在每秒幾萬,甚至每秒數十萬,對高併發的承載能力比數據庫系統要高出一到兩個數量級。因此你徹底能夠根據系統的業務特性,對那種寫少讀多的請求,引入緩存集羣。具體來講,就是在寫數據庫的時候同時寫一份數據到緩存集羣裏,而後用緩存集羣來承載大部分的讀請求。這樣的話,經過緩存集羣,就能夠用更少的機器資源承載更高的併發。
clipboard.png

結語

一個完整而複雜的高併發系統架構中,必定會包含:各類複雜的自研基礎架構系統。各類精妙的架構設計.所以一篇小文頂多具備拋磚引玉的效果,可是數據庫優化的思想差很少就這些了.

相關文章
相關標籤/搜索