大佬是怎麼思考設計MySQL優化方案的？

時間 2019-11-07

標籤大佬怎麼思考設計 mysql 優化方案欄目興趣愛好简体版

原文原文鏈接

在進行MySQL的優化以前，必需要了解的就是MySQL的查詢過程，不少查詢優化工做實際上就是遵循一些原則，讓MySQL的優化器可以按照預想的合理方式運行而已。mysql

1、優化的哲學

注：優化有風險，涉足需謹慎

一、優化可能帶來的問題

優化不老是對一個單純的環境進行，還極可能是一個複雜的已投產的系統；
優化手段原本就有很大的風險，只不過你沒能力意識到和預見到；
任何的技術能夠解決一個問題，但必然存在帶來一個問題的風險；
對於優化來講解決問題而帶來的問題，控制在可接受的範圍內纔是有成果；
保持現狀或出現更差的狀況都是失敗！

二、優化的需求

穩定性和業務可持續性，一般比性能更重要；
優化不可避免涉及到變動，變動就有風險；
優化使性能變好，維持和變差是等機率事件；
切記優化，應該是各部門協同，共同參與的工做，任何單一部門都不能對數據庫進行優化！

因此優化工做，是由業務須要驅使的！linux

三、優化由誰參與

在進行數據庫優化時，應由數據庫管理員、業務部門表明、應用程序架構師、應用程序設計人員、應用程序開發人員、硬件及系統管理員、存儲管理員等，業務相關人員共同參與。ios

2、優化思路

一、優化什麼

在數據庫優化上有兩個主要方面：即安全與性能。redis

安全->數據可持續性；
性能->數據的高性能訪問。

二、優化的範圍有哪些

存儲、主機和操做系統方面：sql

主機架構穩定性；
I/O規劃及配置；
Swap交換分區；
OS內核參數和網絡問題。

應用程序方面：shell

應用程序穩定性；
SQL語句性能；
串行訪問資源；
性能欠佳會話管理；
這個應用適不適合用MySQL。

數據庫優化方面：數據庫

內存；
數據庫結構（物理&邏輯）；
實例配置；

說明：不論是設計系統、定位問題仍是優化，均可以按照這個順序執行。

三、優化維度

數據庫優化維度有四個：express

硬件、系統配置、數據庫表結構、SQL及索引。vim

優化選擇：緩存

優化成本：硬件>系統配置>數據庫表結構>SQL及索引；
優化效果：硬件<系統配置<數據庫表結構<SQL及索引；

3、優化工具備啥？

一、數據庫層面

檢查問題經常使用工具：

1）MySQL
2）msyqladmin：MySQL客戶端，可進行管理操做
3）mysqlshow：功能強大的查看shell命令
4）show [SESSION | GLOBAL] variables：查看數據庫參數信息
5）SHOW [SESSION | GLOBAL] STATUS：查看數據庫的狀態信息
6）information_schema：獲取元數據的方法
7）SHOW ENGINE INNODB STATUS：Innodb引擎的全部狀態
8）SHOW PROCESSLIST：查看當前全部鏈接session狀態
9）explain：獲取查詢語句的執行計劃
10）show index：查看錶的索引信息
11）slow-log：記錄慢查詢語句
12）mysqldumpslow：分析slowlog文件的

不經常使用但好用的工具：

1）Zabbix：監控主機、系統、數據庫（部署zabbix監控平臺）
2）pt-query-digest：分析慢日誌
3）MySQL slap：分析慢日誌
4）sysbench：壓力測試工具
5）MySQL profiling：統計數據庫總體狀態工具
6）Performance Schema：MySQL性能狀態統計的數據
7）workbench：管理、備份、監控、分析、優化工具（比較費資源）

二、數據庫層面問題解決思路

通常應急調優的思路：針對忽然的業務辦理卡頓，沒法進行正常的業務處理，須要立馬解決的場景。

1）show processlist；
2）explain select id ,name from stu where name='clsn'; # ALL id name age sex；
select id,name from stu where id=2-1 函數結果集>30；show index from table；
3）經過執行計劃判斷，索引問題（有沒有、合不合理）或者語句自己問題；
4）show status like '%lock%'; # 查詢鎖狀態
kill SESSION_ID; # 殺掉有問題的session。

常規調優思路：針對業務週期性的卡頓，例如在天天10-11點業務特別慢，可是還可以使用，過了這段時間就行了。

1）查看slowlog，分析slowlog，分析出查詢慢的語句；
2）按照必定優先級，一個一個排查全部慢語句；
3）分析top SQL，進行explain調試，查看語句執行時間；
4）調整索引或語句自己。

三、系統層面

Cpu方面：

vmstat、sar top、htop、nmon、mpstat；

內存：

free、ps-aux；

IO設備（磁盤、網絡）：

iostat、ss、netstat、iptraf、iftop、lsof；

vmstat命令說明：

1）Procs：r顯示有多少進程正在等待CPU時間。b顯示處於不可中斷的休眠的進程數量。在等待I/O。
2）Memory：swpd顯示被交換到磁盤的數據塊的數量。未被使用的數據塊，用戶緩衝數據塊，用於操做系統的數據塊的數量。
3）Swap：操做系統每秒從磁盤上交換到內存和從內存交換到磁盤的數據塊的數量。s1和s0最好是0。
4）Io：每秒從設備中讀入b1的寫入到設備b0的數據塊的數量。反映了磁盤I/O。
5）System：顯示了每秒發生中斷的數量（in）和上下文交換（cs）的數量。
6）Cpu：顯示用於運行用戶代碼，系統代碼，空閒，等待I/O的Cpu時間。

iostat命令說明：

實例命令：iostat -dk 1 5
　　　　 iostat -d -k -x 5 （查看設備使用率（%util）和響應時間（await））
1）tps：該設備每秒的傳輸次數。「一次傳輸」意思是「一次I/O請求」。多個邏輯請求可能會被合併爲「一次I/O請求」。
2）iops ：硬件出廠的時候，廠家定義的一個每秒最大的IO次數
3）"一次傳輸"請求的大小是未知的。
4）kB_read/s：每秒從設備（drive expressed）讀取的數據量；
5）KB_wrtn/s：每秒向設備（drive expressed）寫入的數據量；
6）kB_read：讀取的總數據量；
7）kB_wrtn：寫入的總數量數據量；這些單位都爲Kilobytes。

四、系統層面問題解決辦法

你認爲到底負載高好，仍是低好呢？在實際的生產中，通常認爲Cpu只要不超過90%都沒什麼問題。

固然不排除下面這些特殊狀況：

Cpu負載高，IO負載低：

1）內存不夠；
2）磁盤性能差；
3）SQL問題--->去數據庫層，進一步排查SQL 問題；
4）IO出問題了（磁盤到臨界了、raid設計很差、raid降級、鎖、在單位時間內tps太高）；
5）tps太高：大量的小數據IO、大量的全表掃描。

IO負載高，Cpu負載低：

1）大量小的IO寫操做：
autocommit，產生大量小IO；IO/PS，磁盤的一個定值，硬件出廠的時候，廠家定義的一個每秒最大的IO次數。
2）大量大的IO 寫操做：SQL問題的概率比較大

IO和cpu負載都很高：

硬件不夠了或SQL存在問題。

4、基礎優化

一、優化思路

定位問題點吮吸：硬件-->系統-->應用-->數據庫-->架構（高可用、讀寫分離、分庫分表）。

處理方向：明確優化目標、性能和安全的折中、防患未然。

二、硬件優化

主機方面：

根據數據庫類型，主機CPU選擇、內存容量選擇、磁盤選擇：
1）平衡內存和磁盤資源；
2）隨機的I/O和順序的I/O；
3）主機 RAID卡的BBU（Battery Backup Unit）關閉。

CPU的選擇：

CPU的兩個關鍵因素：核數、主頻
根據不一樣的業務類型進行選擇：
1）CPU密集型：計算比較多，OLTP - 主頻很高的cpu、核數還要多
2）IO密集型：查詢比較，OLAP - 核數要多，主頻不必定高的

內存的選擇：

OLAP類型數據庫，須要更多內存，和數據獲取量級有關。
OLTP類型數據通常內存是Cpu核心數量的2倍到4倍，沒有最佳實踐。

存儲方面：

1）根據存儲數據種類的不一樣，選擇不一樣的存儲設備；
2）配置合理的RAID級別（raid五、raid十、熱備盤）；
3）對與操做系統來說，不須要太特殊的選擇，最好作好冗餘（raid1）（ssd、sas、sata）。
4）raid卡：

主機raid卡選擇：
       實現操做系統磁盤的冗餘（raid1）；
       平衡內存和磁盤資源；
       隨機的I/O和順序的I/O；
       主機raid卡的BBU（Battery Backup Unit）要關閉。

網絡設備方面：

使用流量支持更高的網絡設備（交換機、路由器、網線、網卡、HBA卡）
注意：以上這些規劃應該在初始設計系統時就應該考慮好。

三、服務器硬件優化

1）物理狀態燈
2）自帶管理設備：遠程控制卡（FENCE設備：ipmi ilo idarc）、開關機、硬件監控。
3）第三方的監控軟件、設備（snmp、agent）對物理設施進行監控。
4）存儲設備：自帶的監控平臺。EMC2（hp收購了）、日立（hds）、IBM低端OEM hds、高端存儲是本身技術，華爲存儲。

四、系統優化

Cpu：

基本不須要調整，在硬件選擇方面下功夫便可。

內存：

基本不須要調整，在硬件選擇方面下功夫便可。

SWAP：

MySQL儘可能避免使用swap。
阿里雲的服務器中默認swap爲0。

IO：

raid、no lvm、ext4或xfs、ssd、IO調度策略。

Swap調整(不使用swap分區)

/proc/sys/vm/swappiness的內容改爲0（臨時），/etc/sysctl. conf上添加vm.swappiness=0（永久）

這個參數決定了Linux是傾向於使用swap，仍是傾向於釋放文件系統cache。在內存緊張的狀況下，數值越低越傾向於釋放文件系統cache。

固然，這個參數只能減小使用swap的機率，並不能避免Linux使用swap。

修改MySQL的配置參數innodb_flush_ method，開啓O_DIRECT模式：

這種狀況下，InnoDB的buffer pool會直接繞過文件系統cache來訪問磁盤，可是redo log依舊會使用文件系統cache。

值得注意的是，Redo log是覆寫模式的，即便使用了文件系統的cache，也不會佔用太多。

IO調度策略:

#echo deadline>/sys/block/sda/queue/scheduler   臨時修改成deadline

永久修改

vi /boot/grub/grub.conf

更改到以下內容:

kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet

五、系統參數調整

Linux系統內核參數優化：

vim/etc/sysctl.conf

net.ipv4.ip_local_port_range = 1024 65535：# 用戶端口範圍

net.ipv4.tcp_max_syn_backlog = 4096 

net.ipv4.tcp_fin_timeout = 30 

fs.file-max=65535：# 系統最大文件句柄，控制的是能打開文件最大數量

用戶限制參數（MySQL能夠不設置如下配置）：

vim/etc/security/limits.conf 

* soft nproc 65535

* hard nproc 65535

* soft nofile 65535

* hard nofile 65535

六、應用優化

業務應用和數據庫應用獨立；

防火牆：iptables、selinux等其餘無用服務（關閉）：

chkconfig --level 23456 acpid off

    chkconfig --level 23456 anacron off

    chkconfig --level 23456 autofs off

    chkconfig --level 23456 avahi-daemon off

    chkconfig --level 23456 bluetooth off

    chkconfig --level 23456 cups off

    chkconfig --level 23456 firstboot off

    chkconfig --level 23456 haldaemon off

    chkconfig --level 23456 hplip off

    chkconfig --level 23456 ip6tables off

    chkconfig --level 23456 iptables  off

    chkconfig --level 23456 isdn off

    chkconfig --level 23456 pcscd off

    chkconfig --level 23456 sendmail  off

    chkconfig --level 23456 yum-updatesd  off

安裝圖形界面的服務器不要啓動圖形界面runlevel 3。

另外，思考未來咱們的業務是否真的須要MySQL，仍是使用其餘種類的數據庫。用數據庫的最高境界就是不用數據庫。

5、數據庫優化

SQL優化方向：執行計劃、索引、SQL改寫。

架構優化方向：高可用架構、高性能架構、分庫分表。

一、數據庫參數優化

調整

實例總體（高級優化，擴展）：

thread_concurrency：# 併發線程數量個數

sort_buffer_size：# 排序緩存

read_buffer_size：# 順序讀取緩存

read_rnd_buffer_size：# 隨機讀取緩存

key_buffer_size：# 索引緩存

thread_cache_size：# (1G—>8, 2G—>16, 3G—>32, >3G—>64)

鏈接層（基礎優化）

設置合理的鏈接客戶和鏈接方式：

max_connections           # 最大鏈接數，看交易筆數設置    

max_connect_errors        # 最大錯誤鏈接數，能大則大

connect_timeout           # 鏈接超時

max_user_connections      # 最大用戶鏈接數

skip-name-resolve         # 跳過域名解析

wait_timeout              # 等待超時

back_log                  # 能夠在堆棧中的鏈接數量

SQL層（基礎優化）

query_cache_size：查詢緩存 >>> OLAP類型數據庫,須要重點加大此內存緩存，可是通常不會超過GB。
對於常常被修改的數據，緩存會立馬失效。
咱們能夠實用內存數據庫（redis、memecache），替代他的功能。

二、存儲引擎層（innodb基礎優化參數）

default-storage-engine

innodb_buffer_pool_size       # 沒有固定大小，50%測試值，看看狀況再微調。可是儘可能設置不要超過物理內存70%

innodb_file_per_table=(1,0)

innodb_flush_log_at_trx_commit=(0,1,2) # 1是最安全的，0是性能最高，2折中

binlog_sync

Innodb_flush_method=(O_DIRECT, fdatasync)

innodb_log_buffer_size           # 100M如下

innodb_log_file_size               # 100M 如下

innodb_log_files_in_group       # 5個成員如下,通常2-3個夠用（iblogfile0-N）

innodb_max_dirty_pages_pct   # 達到百分之75的時候刷寫 內存髒頁到磁盤。

log_bin

max_binlog_cache_size                     # 能夠不設置

max_binlog_size                               # 能夠不設置

innodb_additional_mem_pool_size     #小於2G內存的機器，推薦值是20M。32G內存以上100M

福利部分

歡迎Java工程師朋友們加入Java高級架構進階： 963944895，羣內提供免費的Java架構學習資料（裏面有高可用、高併發、高性能及分佈式、Jvm性能調優、Spring源碼，MyBatis，Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料）合理利用本身每一分每一秒的時間來學習提高本身，不要再用"沒有時間「來掩飾本身思想上的懶惰！趁年輕，使勁拼，給將來的本身一個交代！