cpu滿問題分析

功能問題,經過日誌,單步調試相對比較好定位。java

 

性能問題,例如線上服務器CPU100%,如何找到相關服務,如何定位問題代碼,更考驗技術人的功底。tomcat

 

作爲開發人員,確定會遇到這類問題,介紹一下分析CPU 100%的方法,先確認是那個進程耗CPU高,再確認進程中的那個線程,最後根據javacore找到對應的線程,看此線程執行什麼代碼。服務器

 

題目運維

某服務器上部署了若干tomcat實例,即若干垂直切分的Java站點服務,以及若干Java微服務,忽然收到運維的CPU異常告警。微服務

問:如何定位是哪一個服務進程致使CPU過載,哪一個線程致使CPU過載,哪段代碼致使CPU過載?工具

 

步驟1、找到最耗CPU的進程性能

工具:top線程

方法調試

  • 執行top -c ,顯示進程運行信息列表
  • 鍵入P (大寫p),進程按照CPU使用率排序

圖示日誌

如上圖,最耗CPU的進程PID爲10765

 

步驟二:找到最耗CPU的線程

工具:top

方法

  • top -Hp 10765 ,顯示一個進程的線程運行信息列表
  • 鍵入P (大寫p),線程按照CPU使用率排序

圖示

 

如上圖,進程10765內,最耗CPU的線程PID爲10804

 

步驟三:將線程PID轉化爲16進制

工具:printf

方法:printf 「%x\n」 10804

圖示

 

如上圖,10804對應的16進制是0x2a34,固然,這一步能夠用計算器。

 

之因此要轉化爲16進制,是由於堆棧裏,線程id是用16進製表示的。

 

步驟四:查看堆棧,找到線程在幹嗎

工具:pstack/jstack/grep

方法:jstack 10765 | grep ‘0x2a34’ -C5 --color

  • 打印進程堆棧
  • 經過線程id,過濾獲得線程堆棧

圖示

 

如上圖,找到了耗CPU高的線程對應的線程名稱「AsyncLogger-1」,以及看到了該線程正在執行代碼的堆棧。

相關文章
相關標籤/搜索