MySQL性能管理及架構設計(三):SQL查詢優化、分庫分表 - 完結篇

MySQL性能管理及架構設計(三):SQL查詢優化、分庫分表 - 完結篇

1、SQL查詢優化(重要

1.1 獲取有性能問題SQL的三種方式

  1. 經過用戶反饋獲取存在性能問題的SQL;
  2. 經過慢查日誌獲取存在性能問題的SQL;
  3. 實時獲取存在性能問題的SQL;

1.1.2 慢查日誌分析工具

相關配置參數:php

slow_query_log # 啓動中止記錄慢查日誌,慢查詢日誌默認是沒有開啓的能夠在配置文件中開啓(on)
slow_query_log_file # 指定慢查日誌的存儲路徑及文件,日誌存儲和數據從存儲應該分開存儲

long_query_time # 指定記錄慢查詢日誌SQL執行時間的閥值默認值爲10秒一般,對於一個繁忙的系統來講,改成0.001秒(1毫秒)比較合適
log_queries_not_using_indexes #是否記錄未使用索引的SQL

經常使用工具:mysqldumpslowpt-query-digestmysql

pt-query-digest --explain h=127.0.0.1,u=root,p=p@ssWord  slow-mysql.log

1.1.3 實時獲取有性能問題的SQL(推薦


88b81ca34b5f0ce0a6734bc143c6fda4.jpeg


SELECT id,user,host,DB,command,time,state,info
FROM information_schema.processlist
WHERE TIME>=60

查詢當前服務器執行超過60sSQL,能夠經過腳本週期性的來執行這條SQL,就能查出有問題的SQLsql

1.2 SQL的解析預處理及生成執行計劃(重要

1.2.1 查詢過程描述(重點!!!


341f7d8ac68cef949a9791b3affa91ef.jpeg


上圖原文鏈接thinkphp

經過上圖能夠清晰的瞭解到MySql查詢執行的大體過程:

  1. 發送SQL語句。
  2. 查詢緩存,若是命中緩存直接返回結果。
  3. SQL解析,預處理,再由優化器生成對應的查詢執行計劃。
  4. 執行查詢,調用存儲引擎API獲取數據。
  5. 返回結果。

1.2.2 查詢緩存對性能的影響(建議關閉緩存

第一階段:
相關配置參數:數據庫

query_cache_type # 設置查詢緩存是否可用
query_cache_size # 設置查詢緩存的內存大小
query_cache_limit # 設置查詢緩存可用的存儲最大值(加上sql_no_cache能夠提升效率)
query_cache_wlock_invalidate # 設置數據表被鎖後是否返回緩存中的數據
query_cache_min_res_unit # 設置查詢緩存分配的內存塊的最小單
緩存查找是利用對大小寫敏感的哈希查找來實現的,Hash查找只能進行全值查找(sql徹底一致),若是緩存命中,檢查用戶權限,若是權限容許,直接返回,查詢不被解析,也不會生成查詢計劃。

在一個讀寫比較頻繁的系統中,建議關閉緩存,由於緩存更新會加鎖。將query_cache_type設置爲off,query_cache_size設置爲0

1.2.3 第二階段:MySQL依照執行計劃和存儲引擎進行交互

這個階段包括了多個子過程:segmentfault

56869c34bfcb38d28a6610e7e83d8ee1.jpeg


a89ebff7618caa0ab2439e70f28991a8.jpeg


9ccc4249b734cd8f8874a23eeecc6997.jpeg


一條查詢能夠有多種查詢方式,查詢優化器會對每一種查詢方式的(存儲引擎)統計信息進行比較,找到成本最低的查詢方式,這也就是索引不能太多的緣由

1.3 會形成MySQL生成錯誤的執行計劃的緣由

一、統計信息不許確
   二、成本估算與實際的執行計劃成本不一樣緩存

a36f544f7fba7a187f0603848d77e444.jpeg


三、給出的最優執行計劃與估計的不一樣服務器

801bb86e19642df8f2da15ef1e3c737a.png


四、MySQL不考慮併發查詢
   五、會基於固定規則生成執行計劃
   六、MySQL不考慮不受其控制的成本,如存儲過程,用戶自定義函數session

1.4 MySQL優化器可優化的SQL類型

查詢優化器:對查詢進行優化並查詢mysql認爲的成本最低的執行計劃。 爲了生成最優的執行計劃,查詢優化器會對一些查詢進行改寫

能夠優化的sql類型架構

一、從新定義表的關聯順序;

b8c0a4086452f24b22245c963b4e6d09.png


二、將外鏈接轉換爲內鏈接;

三、使用等價變換規則;

4f697d028b024f79504aca13234044c3.png


四、優化count(),min(),max();

60a3d0055b866d3b5c98b2c9171da6ad.jpeg


五、將一個表達式轉換爲常數;
 六、子查詢優化;

871083a54f061e7cb1ae0cae7f0745ae.png


七、提早終止查詢,如發現一個不成立條件(如where id = -1),當即返回一個空結果;

八、對in()條件進行優化;

1.5 查詢處理各個階段所須要的時間

1.5.1 使用profile(目前已經不推薦使用了)

set profiling = 1; #啓動profile,這是一個session級的配製執行查詢

show profiles; # 查詢每個查詢所消耗的總時間的信息

show profiles for query N; # 查詢的每一個階段所消耗的時間

1.5.2 performance_schema是5.5引入的一個性能分析引擎(5.5版本時期開銷比較大)

啓動監控和歷史記錄表:use performance_schema

update setup_instruments set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'stage%';

update set_consumbers set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'event%';

4f8074703689c0915e0d541027019bbc.jpeg


b61cf1ac36041da9edc5b260735705ba.jpeg


1.6 特定SQL的查詢優化

1.6.1 大表的數據修改

d34fc53fa197cfed7323ebfd24cd41d0.jpeg


b1406c3f8f4e0f8be62433202308182d.jpeg


1.6.2 大表的結構修改

85946db3950e2a289b6d2a89cb9bdedc.jpeg


  1. 利用主從複製,先對從服務器進入修改,而後主從切換
  2. (推薦)
添加一個新表(修改後的結構),老表數據導入新表,老表創建觸發器,修改數據同步到新表, 老表加一個排它鎖(重命名), 新表重命名, 刪除老表。

30bb1f1de1114c23621810984345d2a2.jpeg


修改語句這個樣子:

alter table sbtest4 modify c varchar(150) not null default ''

利用工具修改:

5c95ebab16e15f0b2d491a50975f9ccc.jpeg


1.6.3 優化not in 和 <> 查詢

子查詢改寫爲關聯查詢:

ec6e39c3ce32e592ca1c9dc0f0a33beb.jpeg


2、分庫分表

2.1 分庫分表的幾種方式

分擔讀負載 可經過 一主多從,升級硬件來解決。

2.1.1 把一個實例中的多個數據庫拆分到不一樣實例(集羣)


af39007a596b707c63c93d1712d2e732.jpeg


拆分簡單,不容許跨庫。但並不能減小寫負載。

2.1.2 把一個庫中的表分離到不一樣的數據庫中


4934e5ae38220b84e4fdad622a7b660e.jpeg


該方式只能在必定時間內減小寫壓力。

以上兩種方式只能暫時解決讀寫性能問題。

2.1.3 數據庫分片

對一個庫中的相關表進行水平拆分到不一樣實例的數據庫中


e4dd475bc9d6bf3e228e33a54504b7c8.jpeg


2.1.3.1 如何選擇分區鍵

  1. 分區鍵要能儘量避免跨分區查詢的發生
  2. 分區鍵要儘量使各個分區中的數據平均

2.1.3.2 分片中如何生成全局惟一ID

741531124e070bde2b4d665e92121b48.jpeg


擴展:表的垂直拆分和水平拆分

完!

原做者:唐成勇
原文連接: 人類身份驗證 - SegmentFault
原出處:思否

ea25b5822a20ead1099963ca08fb49f6.jpeg

相關文章
相關標籤/搜索