linux cpu佔用100%排查

某服務器上部署了若干tomcat實例,即若干垂直切分的Java站點服務,以及若干Java微服務,忽然收到運維的CPU異常告警。tomcat

問:如何定位是哪一個服務進程致使CPU過載,哪一個線程致使CPU過載,哪段代碼致使CPU過載?服務器

步驟1、找到最耗CPU的進程運維

工具:top微服務

方法:工具

  • 執行top -c ,顯示進程運行信息列表spa

  • 鍵入P (大寫p),進程按照CPU使用率排序線程

圖示:blog

線上服務CPU100%問題快速定位實戰

如上圖,最耗CPU的進程PID爲10765排序

步驟二:找到最耗CPU的線程進程

工具:top

方法:

  • top -Hp 10765 ,顯示一個進程的線程運行信息列表

  • 鍵入P (大寫p),線程按照CPU使用率排序

圖示:

線上服務CPU100%問題快速定位實戰

如上圖,進程10765內,最耗CPU的線程PID爲10804

步驟三:將線程PID轉化爲16進制

工具:printf

方法:printf 「%x」 10804

圖示:

線上服務CPU100%問題快速定位實戰

如上圖,10804對應的16進制是0x2a34,固然,這一步能夠用計算器。

之因此要轉化爲16進制,是由於堆棧裏,線程id是用16進製表示的。

步驟四:查看堆棧,找到線程在幹嗎

工具:pstack/jstack/grep

方法:jstack 10765 | grep ‘0x2a34’ -C5 --color

  • 打印進程堆棧

  • 經過線程id,過濾獲得線程堆棧

圖示:

線上服務CPU100%問題快速定位實戰

如上圖,找到了耗CPU高的線程對應的線程名稱「AsyncLogger-1」,以及看到了該線程正在執行代碼的堆棧。

相關文章
相關標籤/搜索