一個應用佔用CPU很高,除了確實是計算密集型應用以外,一般緣由都是出現了死循環。html
根據top命令,發現PID爲28555的Java進程佔用CPU高達200%,出現故障。java
經過ps aux | grep PID命令,能夠進一步肯定是tomcat進程出現了問題。可是,怎麼定位到具體線程或者代碼呢?數組
首先顯示線程列表:tomcat
ps -mp pid -o THREAD,tid,time工具
找到了耗時最高的線程28802,佔用CPU時間快兩個小時了!post
其次將須要的線程ID轉換爲16進制格式:spa
printf "%x\n" tid.net
最後打印線程的堆棧信息:線程
jstack pid |grep tid -A 303d
找到出現問題的代碼了!
最後,總結下排查CPU故障的方法和技巧有哪些:
一、top命令:Linux命令。能夠查看實時的CPU使用狀況。也能夠查看最近一段時間的CPU使用狀況。
二、PS命令:Linux命令。強大的進程狀態監控命令。能夠查看進程以及進程中線程的當前CPU使用狀況。屬於當前狀態的採樣數據。
三、jstack:Java提供的命令。能夠查看某個進程的當前線程棧運行狀況。根據這個命令的輸出能夠定位某個進程的全部線程的當前運行狀態、運行代碼,以及是否死鎖等等。
四、pstack:Linux命令。能夠查看某個進程的當前線程棧運行狀況。
搞Java開發的,常常會碰到下面兩種異常:
一、java.lang.OutOfMemoryError: PermGen space
二、java.lang.OutOfMemoryError: Java heap space
要詳細解釋這兩種異常,須要簡單重提下Java內存模型。
Java內存模型是描述Java程序中各變量(實例域、靜態域和數組元素)之間的關係,以及在實際計算機系統中將變量存儲到內存和從內存取出變量這樣的低層細節。
在Java虛擬機中,內存分爲三個代:新生代(New)、老生代(Old)、永久代(Perm)。
(1)新生代New:新建的對象都存放這裏
(2)老生代Old:存放重新生代New中遷移過來的生命週期較久的對象。新生代New和老生代Old共同組成了堆內存。
(3)永久代Perm:是非堆內存的組成部分。主要存放加載的Class類級對象如class自己,method,field等等。
若是出現java.lang.OutOfMemoryError: Java heap space異常,說明Java虛擬機的堆內存不夠。緣由有二:
(1)Java虛擬機的堆內存設置不夠,能夠經過參數-Xms、-Xmx來調整。
(2)代碼中建立了大量大對象,而且長時間不能被垃圾收集器收集(存在被引用)。
若是出現java.lang.OutOfMemoryError: PermGen space,說明是Java虛擬機對永久代Perm內存設置不夠。
通常出現這種狀況,都是程序啓動須要加載大量的第三方jar包。例如:在一個Tomcat下部署了太多的應用。
從代碼的角度,軟件開發人員主要關注java.lang.OutOfMemoryError: Java heap space異常,減小沒必要要的對象建立,同時避免內存泄漏。
如今以一個實際的例子分析內存佔用的故障排查。
經過top命令,發現PID爲9004的Java進程一直佔用比較高的內存不釋放(24.7%),出現高內存佔用的故障。
想起上一篇線上應用故障排查之一:高CPU佔用介紹的PS命令,可否找到具體是哪一個的線程呢?
ps -mp 9004 -o THREAD,tid,time,rss,size,%mem
遺憾的是,發現PS命令能夠查到具體進程的CPU佔用狀況,可是不能查到一個進程下具體線程的內存佔用狀況。
只好尋求其餘方法了,幸虧Java提供了一個很好的內存監控工具:jmap命令
jmap命令有下面幾種經常使用的用法:
•jmap [pid]
•jmap -histo:live [pid] >a.log
•jmap -dump:live,format=b,file=xxx.xxx [pid]
用得最可能是後面兩個。其中,jmap -histo:live [pid] 能夠查看當前Java進程建立的活躍對象數目和佔用內存大小。
jmap -dump:live,format=b,file=xxx.xxx [pid] 則能夠將當前Java進程的內存佔用狀況導出來,方便用專門的內存分析工具(例如:MAT)來分析。
這個命令對於分析是否有內存泄漏頗有幫助。具體怎麼使用能夠查看本博的另外一篇文章:利用Eclipse Memory Analyzer Tool(MAT)分析內存泄漏
這裏詳細介紹下jmap -histo:live [pid] 命令:
從上圖能夠看出,int數組、constMethodKlass、methodKlass、constantPoolKlass都佔用了大量的內存。
特別是佔用了大量內存的int數組,須要仔細檢查相關代碼。
最後,總結下排查內存故障的方法和技巧有哪些:
一、top命令:Linux命令。能夠查看實時的內存使用狀況。
二、jmap -histo:live [pid],而後分析具體的對象數目和佔用內存大小,從而定位代碼。
三、jmap -dump:live,format=b,file=xxx.xxx [pid],而後利用MAT工具分析是否存在內存泄漏等等。