如何迅速分析出系統I/O的瓶頸在哪裏?

性能指標

老規矩,咱們先來回顧一下,描述 I/O 的性能指標有哪些?你能夠先回想一下文件系統和磁盤 I/O 的原理,結合下面這張 Linux 系統的 I/O 棧圖,憑着記憶和理解本身寫一寫。或者,你也能夠打開前面的文章,挨個複習總結一下。mysql

如何迅速分析出系統I/O的瓶頸在哪裏?

 

說了這麼久的 I/O 性能知識,一提及 I/O 指標,你應該首先會想到分類描述。咱們要區分開文件系統和磁盤,分別用不一樣指標來描述它們的性能。ios

文件系統I/O性能指標

咱們先來看文件系統的狀況。redis

首先,最容易想到的是存儲空間的使用狀況,包括容量、使用量以及剩餘空間等。咱們一般也稱這些爲磁盤空間的使用量,由於文件系統的數據最終仍是存儲在磁盤上。sql

不過要注意,這些只是文件系統向外展現的空間使用,而非在磁盤空間的真實用量,由於文件系統的元數據也會佔用磁盤空間。數據庫

並且,若是你配置了 RAID,從文件系統看到的使用量跟實際磁盤的佔用空間,也會由於RAID 級別的不一樣而不同。比方說,配置 RAID10 後,你從文件系統最多也只能看到全部磁盤容量的一半。緩存

除了數據自己的存儲空間,還有一個容易忽略的是索引節點的使用狀況,它也包括容量、使用量以及剩餘量等三個指標。若是文件系統中存儲過多的小文件,就可能碰到索引節點容量已滿的問題。網絡

其次,你應該想到的是前面屢次提到過的緩存使用狀況,包括頁緩存、目錄項緩存、索引節點緩存以及各個具體文件系統(如 ext四、XFS 等)的緩存。這些緩存會使用速度更快的內存,用來臨時存儲文件數據或者文件系統的元數據,從而能夠減小訪問慢速磁盤的次數。工具

除了以上這兩點,文件 I/O 也是很重要的性能指標,包括 IOPS(包括 r/s 和 w/s)、響應時間(延遲)以及吞吐量(B/s)等。在考察這類指標時,一般還要考慮實際文件的讀寫狀況。好比,結合文件大小、文件數量、I/O 類型等,綜合分析文件 I/O 的性能。oop

誠然,這些性能指標很是重要,但不幸的是,Linux 文件系統並沒提供,直接查看這些指標的方法。咱們只能經過系統調用、動態跟蹤或者基準測試等方法,間接進行觀察、評估。不過,實際上,這些指標在咱們考察磁盤性能時更容易見到,由於 Linux 爲磁盤性能提供了更詳細的數據。性能

磁盤I/O性能指標

接下來,咱們就來具體看看,哪些性能指標能夠衡量磁盤 I/O 的性能。

在磁盤 I/O 原理的文章中,我曾提到過四個核心的磁盤 I/O 指標。

  • 使用率,是指磁盤忙處理 I/O 請求的百分比。太高的使用率(好比超過 60%)一般意味着磁盤 I/O 存在性能瓶頸。
  • IOPS(Input/Output Per Second),是指每秒的 I/O 請求數。
  • 吞吐量,是指每秒的 I/O 請求大小。
  • 響應時間,是指從發出 I/O 請求到收到響應的間隔時間。

考察這些指標時,必定要注意綜合 I/O 的具體場景來分析,好比讀寫類型(順序仍是隨機)、讀寫比例、讀寫大小、存儲類型(有無 RAID 以及 RAID 級別、本地存儲仍是網絡存儲)等。

不過,這裏有個大忌,就是把不一樣場景的 I/O 性能指標,直接進行分析對比。這是很常見的一個誤區,你必定要避免。

除了這些指標外,在前面 Cache 和 Buffer 原理的文章中,我曾屢次提到,緩衝區(Buffer)也是要重點掌握的指標,它常常出如今內存和磁盤問題的分析中。

文件系統和磁盤 I/O 的這些指標都頗有用,須要咱們熟練掌握,因此我總結成了一張圖,幫你分類和記憶。你能夠保存並打印出來,方便隨時查看複習,也能夠把它當成 I/O 性能分析的「指標篩選」清單使用。

如何迅速分析出系統I/O的瓶頸在哪裏?

 

性能工具

掌握文件系統和磁盤 I/O 的性能指標後,咱們還要知道,怎樣去獲取這些指標,也就是搞明白工具的使用問題。

第一,在文件系統的原理中,我介紹了查看文件系統容量的工具 df。它既能夠查看文件系統數據的空間容量,也能夠查看索引節點的容量。至於文件系統緩存,咱們經過/proc/meminfo、/proc/slabinfo 以及 slabtop 等各類來源,觀察頁緩存、目錄項緩存、索引節點緩存以及具體文件系統的緩存狀況。

第二,在磁盤 I/O 的原理中,咱們分別用 iostat 和 pidstat 觀察了磁盤和進程的 I/O 狀況。它們都是最經常使用的 I/O 性能分析工具。經過 iostat ,咱們能夠獲得磁盤的 I/O 使用率、吞吐量、響應時間以及 IOPS 等性能指標;而經過 pidstat ,則能夠觀察到進程的 I/O吞吐量以及塊設備 I/O 的延遲等。

第三,在狂打日誌的案例中,咱們先用 top 查看系統的 CPU 使用狀況,發現 iowait 比較高;而後,又用 iostat 發現了磁盤的 I/O 使用率瓶頸,並用 pidstat 找出了大量 I/O 的進程;最後,經過 strace 和 lsof,咱們找出了問題進程正在讀寫的文件,並最終鎖定性能問題的來源——原來是進程在狂打日誌。

第四,在磁盤 I/O 延遲的單詞熱度案例中,咱們一樣先用 top、iostat ,發現磁盤有 I/O瓶頸,並用 pidstat 找出了大量 I/O 的進程。可接下來,想要照搬上次操做的咱們失敗了。在隨後的 strace 命令中,咱們竟然沒看到 write 系統調用。因而,咱們換了一個思路,用新工具 filetop 和 opensnoop ,從內核中跟蹤系統調用,最終找出瓶頸的來源。

最後,在 MySQL 和 Redis 的案例中,一樣的思路,咱們先用 top、iostat 以及 pidstat ,肯定並找出 I/O 性能問題的瓶頸來源,它們正是 mysqld 和 redis-server。隨後,咱們又用 strace+lsof 找出了它們正在讀寫的文件。

關於 MySQL 案例,根據 mysqld 正在讀寫的文件路徑,再結合 MySQL 數據庫引擎的原理,咱們不只找出了數據庫和數據表的名稱,還進一步發現了慢查詢的問題,最終經過優化索引解決了性能瓶頸。

至於 Redis 案例,根據 redis-server 讀寫的文件,以及正在進行網絡通訊的 TCPSocket,再結合 Redis 的工做原理,咱們發現 Redis 持久化選項配置有問題;從 TCPSocket 通訊的數據中,咱們還發現了客戶端的不合理行爲。因而,咱們修改 Redis 配置選項,並優化了客戶端使用 Redis 的方式,從而減小網絡通訊次數,解決性能問題。

性能指標和工具的聯繫

同前面 CPU 和內存板塊的學習同樣,我建議從指標和工具兩個不一樣維度出發,整理記憶。

從 I/O 指標出發,你更容易把性能工具同系統工做原理關聯起來,對性能問題有宏觀的認識和把握。而從性能工具出發,可讓你更快上手使用工具,迅速找出咱們想觀察的性能指標。特別是在工具備限的狀況下,咱們更要充分利用好手頭的每個工具,少許工具也要盡力挖掘出大量信息。

第一個維度,從文件系統和磁盤 I/O 的性能指標出發。換句話說,當你想查看某個性能指標時,要清楚知道,哪些工具能夠作到

根據不一樣的性能指標,對提供指標的性能工具進行分類和理解。這樣,在實際排查性能問題時,你就能夠清楚知道,什麼工具能夠提供你想要的指標,而不是毫無根據地挨個嘗試,撞運氣。

雖然你不須要把全部相關的工具背下來,但若是能記清楚每一個指標對應的工具特性,實際操做起來,必定能更高效、靈活。

這裏,我把提供 I/O 性能指標的工具作成了一個表格,方便你梳理關係和理解記憶。你能夠把它保存並打印出來,隨時記憶。固然,你也能夠把它當成一個「指標工具」指南來使用。

如何迅速分析出系統I/O的瓶頸在哪裏?

 

下面,咱們再來看第二個維度。

第二個維度,從工具出發。也就是當你已經安裝了某個工具後,要知道這個工具能提供哪些指標

這在實際環境中,特別是生產環境中也是很是重要的。由於不少狀況下,你並無權限安裝新的工具包,只能最大化地利用好系統已有的工具,而這就須要你對它們有足夠的瞭解。

具體到每一個工具的使用方法,通常都支持豐富的配置選項。不過不用擔憂,這些配置選項並不用背下來。你只要知道有哪些工具,以及這些工具的基本功能是什麼就夠了。真正要用到的時候, 經過 man 命令,查它們的使用手冊就能夠了。

一樣的,我也將這些經常使用工具彙總成了一個表格,方便你區分和理解。天然,你也能夠當成一個「工具指標」指南使用,須要時查表便可。

如何迅速分析出系統I/O的瓶頸在哪裏?

 

如何迅速分析I/O的性能瓶頸

到這裏,相信你對內存的性能指標已經很是熟悉,也清楚每種性能指標分別能用什麼工具來獲取。

你應該發現了,比起前兩個板塊,雖然文件系統和磁盤的 I/O 性能指標仍比較多,但核心的性能工具,其實就是那麼幾個。熟練掌握它們,再根據實際系統的現象,並配合系統和應用程序的原理, I/O 性能分析就很清晰了。

不過,無論怎麼說,若是每次一碰到 I/O 的性能問題,就把上面提到的全部工具跑一遍,確定是不現實的。

在實際生產環境中,咱們但願的是,儘量快地定位系統的瓶頸,而後儘量快地優化性能,也就是要又快又準地解決性能問題。

那有沒有什麼方法,能夠又快又準地找出系統的 I/O 瓶頸呢?答案是確定的。

仍是那句話,找關聯。多種性能指標間都有必定的關聯性,不要徹底孤立的看待他們。想弄清楚性能指標的關聯性,就要通曉每種性能指標的工做原理。這也是爲何我在介紹每一個性能指標時,都要穿插講解相關的系統原理,再次但願你能記住這一點。

以咱們前面幾期的案例爲例,若是你仔細對比前面的幾個案例,從 I/O 延遲的案例到MySQL 和 Redis 的案例,就會發現,雖然這些問題千差萬別,但從 I/O 角度來分析,最開始的分析思路基本上相似,都是:

  1. 先用 iostat 發現磁盤 I/O 性能瓶頸;
  2. 再借助 pidstat ,定位出致使瓶頸的進程;
  3. 隨後分析進程的 I/O 行爲;
  4. 最後,結合應用程序的原理,分析這些 I/O 的來源。

因此,爲了縮小排查範圍,我一般會先運行那幾個支持指標較多的工具,如 iostat、vmstat、pidstat 等。而後再根據觀察到的現象,結合系統和應用程序的原理,尋找下一步的分析方向。我把這個過程畫成了一張圖,你能夠保存下來參考使用。

如何迅速分析出系統I/O的瓶頸在哪裏?

 

圖中列出了最經常使用的幾個文件系統和磁盤 I/O 性能分析工具,以及相應的分析流程,箭頭則表示分析方向。這其中,iostat、vmstat、pidstat 是最核心的幾個性能工具,它們也提供了最重要的 I/O 性能指標。舉幾個例子你可能更容易理解。

例如,在前面講過的 MySQL 和 Redis 案例中,咱們就是經過 iostat 確認磁盤出現 I/O 性能瓶頸,而後用 pidstat 找出 I/O 最大的進程,接着藉助 strace 找出該進程正在讀寫的文件,最後結合應用程序的原理,找出大量 I/O 的緣由。

再如,當你用 iostat 發現磁盤有 I/O 性能瓶頸後,再用 pidstat 和 vmstat 檢查,可能會發現 I/O 來自內核線程,如 Swap 使用大量升高。這種狀況下,你就得進行內存分析了,先找出佔用大量內存的進程,再設法減小內存的使用。

另外注意,我在這個圖中只列出了最核心的幾個性能工具,並無列出前面表格中的全部工具。這麼作,一方面是不想用大量的工具列表嚇到你。在學習之初就接觸全部核心或小衆的工具,不見得是好事。另外一方面,也是但願你能先把重心放在覈心工具上,畢竟熟練掌握它們,就能夠解決大多數問題。

因此,你能夠保存下這張圖,做爲文件系統和磁盤 I/O 性能分析的思路圖譜。從最核心的這幾個工具開始,經過我提供的那些案例,本身在真實環境裏實踐,拿下它們。

總結

本文,咱們一塊兒複習了常見的文件系統和磁盤 I/O 性能指標,梳理了常見的 I/O 性能觀測工具,並創建了性能指標和工具的關聯。最後,咱們還總結了快速分析 I/O 性能問題的思路。

仍是那句話,雖然 I/O 的性能指標不少,相應的性能分析工具也有很多,但熟悉了各指標含義後,你就會天然找到它們的關聯。順着這個思路往下走,掌握經常使用的分析套路也並不難。

相關文章
相關標籤/搜索