某服務器上部署了若干tomcat實例,即若干垂直切分的Java站點服務,以及若干Java微服務,忽然收到運維的CPU異常告警。tomcat
問:如何定位是哪一個服務進程致使CPU過載,哪一個線程致使CPU過載,哪段代碼致使CPU過載?服務器
步驟1、找到最耗CPU的進程運維
工具:top微服務
方法:工具
執行top -c ,顯示進程運行信息列表spa
鍵入P (大寫p),進程按照CPU使用率排序線程
圖示:blog
如上圖,最耗CPU的進程PID爲10765排序
步驟二:找到最耗CPU的線程進程
工具:top
方法:
top -Hp 10765 ,顯示一個進程的線程運行信息列表
鍵入P (大寫p),線程按照CPU使用率排序
圖示:
如上圖,進程10765內,最耗CPU的線程PID爲10804
步驟三:將線程PID轉化爲16進制
工具:printf
方法:printf 「%x」 10804
圖示:
如上圖,10804對應的16進制是0x2a34,固然,這一步能夠用計算器。
之因此要轉化爲16進制,是由於堆棧裏,線程id是用16進製表示的。
步驟四:查看堆棧,找到線程在幹嗎
工具:pstack/jstack/grep
方法:jstack 10765 | grep ‘0x2a34’ -C5 --color
打印進程堆棧
經過線程id,過濾獲得線程堆棧
圖示:
如上圖,找到了耗CPU高的線程對應的線程名稱「AsyncLogger-1」,以及看到了該線程正在執行代碼的堆棧。