IG牛皮 JVM命令-java服務器故障排查

1、top(Linux命令)java

執行top命令: (查看進程15477的詳細狀況,下文用到)sql

系統信息(前五行):

第1行:Top 任務隊列信息(系統運行狀態及平均負載),與uptime命令結果相同。 第1段:系統當前時間,例如:16:07:37 第2段:系統運行時間,未重啓的時間,時間越長系統越穩定。 格式:up xx days, HH:MM 例如:241 days, 20:11, 表示連續運行了241天20小時11分鐘 第3段:當前登陸用戶數,例如:1 user,表示當前只有1個用戶登陸 第4段:系統負載,即任務隊列的平均長度,3個數值分別統計最近1,5,15分鐘的系統平均負載 系統平均負載:單核CPU狀況下,0.00 表示沒有任何負荷,1.00表示恰好滿負荷,超過1側表示超負荷,理想值是0.7; 多核CPU負載:CPU核數 * 理想值0.7 = 理想負荷,例如:4核CPU負載不超過2.8何表示沒有出現高負載。 第2行:Tasks 進程相關信息 第1段:進程總數,例如:Tasks: 231 total, 表示總共運行231個進程 第2段:正在運行的進程數,例如:1 running, 第3段:睡眠的進程數,例如:230 sleeping, 第4段:中止的進程數,例如:0 stopped, 第5段:殭屍進程數,例如:0 zombie 第3行:Cpus CPU相關信息,若是是多核CPU,按數字1可顯示各核CPU信息,此時1行將轉爲Cpu核數行,數字1能夠來回切換。 第1段:us 用戶空間佔用CPU百分比,例如:Cpu(s): 12.7%us, 第2段:sy 內核空間佔用CPU百分比,例如:8.4%sy, 第3段:ni 用戶進程空間內改變過優先級的進程佔用CPU百分比,例如:0.0%ni, 第4段:id 空閒CPU百分比,例如:77.1%id, 第5段:wa 等待輸入輸出的CPU時間百分比,例如:0.0%wa, 第6段:hi CPU服務於硬件中斷所耗費的時間總額,例如:0.0%hi, 第7段:si CPU服務軟中斷所耗費的時間總額,例如:1.8%si, 第8段:st Steal time 虛擬機被hypervisor偷去的CPU時間(若是當前處於一個hypervisor下的vm,實際上hypervisor也是要消耗一部分CPU處理時間的) 第4行:Mem 內存相關信息(Mem: 12196436k total, 12056552k used, 139884k free, 64564k buffers) 第1段:物理內存總量,例如:Mem: 12196436k total, 第2段:使用的物理內存總量,例如:12056552k used, 第3段:空閒內存總量,例如:Mem: 139884k free, 第4段:用做內核緩存的內存量,例如:64564k buffers 第5行:Swap 交換分區相關信息(Swap: 2097144k total, 151016k used, 1946128k free, 3120236k cached) 第1段:交換區總量,例如:Swap: 2097144k total, 第2段:使用的交換區總量,例如:151016k used, 第3段:空閒交換區總量,例如:1946128k free, 第4段:緩衝的交換區總量,3120236k cached 進程信息:數組

在top命令中按f按能夠查看顯示的列信息,按對應字母來開啓/關閉列,大寫字母表示開啓,小寫字母表示關閉。帶*號的是默認列。緩存

A: PID = (Process Id) 進程Id; E: USER = (User Name) 進程全部者的用戶名; H: PR = (Priority) 優先級 I: NI = (Nice value) nice值。負值表示高優先級,正值表示低優先級 O: VIRT = (Virtual Image (kb)) 進程使用的虛擬內存總量,單位kb。VIRT=SWAP+RES Q: RES = (Resident size (kb)) 進程使用的、未被換出的物理內存大小,單位kb。RES=CODE+DATA T: SHR = (Shared Mem size (kb)) 共享內存大小,單位kb W: S = (Process Status) 進程狀態。D=不可中斷的睡眠狀態,R=運行,S=睡眠,T=跟蹤/中止,Z=殭屍進程 K: %CPU = (CPU usage) 上次更新到如今的CPU時間佔用百分比 N: %MEM = (Memory usage (RES)) 進程使用的物理內存百分比 M: TIME+ = (CPU Time, hundredths) 進程使用的CPU時間總計,單位1/100秒 b: PPID = (Parent Process Pid) 父進程Id c: RUSER = (Real user name) d: UID = (User Id) 進程全部者的用戶id f: GROUP = (Group Name) 進程全部者的組名 g: TTY = (Controlling Tty) 啓動進程的終端名。不是從終端啓動的進程則顯示爲 ? j: P = (Last used cpu (SMP)) 最後使用的CPU,僅在多CPU環境下有意義 p: SWAP = (Swapped size (kb)) 進程使用的虛擬內存中,被換出的大小,單位kb l: TIME = (CPU Time) 進程使用的CPU時間總計,單位秒 r: CODE = (Code size (kb)) 可執行代碼佔用的物理內存大小,單位kb s: DATA = (Data+Stack size (kb)) 可執行代碼之外的部分(數據段+棧)佔用的物理內存大小,單位kb u: nFLT = (Page Fault count) 頁面錯誤次數 v: nDRT = (Dirty Pages count) 最後一次寫入到如今,被修改過的頁面數 y: WCHAN = (Sleeping in Function) 若該進程在睡眠,則顯示睡眠中的系統函數名 z: Flags = (Task Flags <sched.h>) 任務標誌,參考 sched.h X: COMMAND = (Command name/line) 命令名/命令行 參考 Linux性能分析工具top命令詳解網絡

執行top -Hp PID,如 top -Hp 15477架構

查看某進程中的線程 注:此時PID是線程id併發

如線程15571有異常須要查看,使用jstack打印堆棧,查看線程15571狀態(15571 16進制=3cd3)app

2、jstack

參考 java命令--jstack 工具分佈式

Java命令學習系列(二)——Jstackide

須要到JDK安裝目錄下使用(可經過ps x查看java進程,獲得jdk安裝目錄)

./jstack PID(進程id) ./jstack 15477

紅框中即爲線程15571(16進制=3cd3) 狀態

分析jstack日誌:

監視器Monitor:

Monitor是 Java中用以實現線程之間的互斥與協做的主要手段,它能夠當作是對象或者 Class的鎖。

每個對象都有,也僅有一個 monitor。

下面這個圖,描述了線程和Monitor之間關係,以及線程的狀態轉換:

進入區(Entrt Set):表示線程經過synchronized要求獲取對象的鎖。若是對象被鎖住,則進入擁有者;不然在進入區等待。一旦對象鎖被其餘線程釋放,當即參與競爭。

擁有者(The Owner):表示某一線程成功競爭到對象鎖。

等待區(Wait Set):表示線程經過對象的object.wait()方法,釋放對象的鎖,並在等待區等待被喚醒。

從圖中能夠看出,一個 Monitor在某個時刻,只能被一個線程擁有,該線程就是 Active Thread,而其它線程都是 Waiting Thread,分別在兩個隊列 Entry Set和 Wait Set裏面等候。

在 Entry Set中等待的線程動做是 Waiting for monitor entry。

在 Wait Set中等待的線程動做是 in Object.wait()。當一個線程申請進入臨界區時,它就進入了 Entry Set隊列。

(咱們稱被 synchronized保護起來的代碼段爲臨界區。當一個線程申請進入臨界區時,它就進入了 「Entry Set 」隊列)

線程狀態:

NEW:未啓動的。不會出如今Dump中。

RUNNABLE:在虛擬機內執行的,運行中狀態。The Owner區

BLOCKED:受阻塞並等待監視器鎖。在Entry Set區等鎖。

WATING:無限期等待另外一個線程執行特定操做。在Wait Set區等待某個condition或monitor發生,通常停留在wait()等語句裏。

TIMED_WATING:有時限的等待另外一個線程的特定操做。在Wait Set區和WAITING的區別是wait() 等語句加上了時間限制 wait(timeout)。

TERMINATED:已退出的。

調用修飾

表示線程在方法調用時,額外的重要的操做。修飾上方的方法調用。

locked <地址> 目標:使用synchronized申請對象鎖成功,監視器的擁有者。The Owner區。

waiting to lock <地址> 目標:使用synchronized申請對象鎖未成功,在Entry Set區等鎖。線程狀態爲Blocked

waiting on <地址> 目標:使用synchronized申請對象鎖成功後,釋放鎖,在Wait Set區等鎖。線程狀態爲WAITING或TIMED_WATING

parking to wait for <地址> 目標:調用了park(),在Wait Set區,等待許可。

(park是基本的線程阻塞原語,不經過監視器在對象上阻塞。

park: 進入WAITING狀態,對比wait不須要得到鎖就可讓線程WAITING,經過unpark喚醒)

線程動做

線程狀態產生的緣由。

runnable:The Owner區,狀態RUNNABLE

in Object.wait():調用wait(),Wait Set區,狀態爲WAITING或TIMED_WAITING,修飾waiting on

waiting for monitor entry:等鎖,Entry Set區,狀態BLOCKED,修飾waiting to lock

waiting on condition:因某種條件被park,Wait Set區,狀態爲parking to wait for

sleeping:休眠的線程,調用了Thread.sleep()

總結

一、查看線程dump,先看線程狀態/線程動做(比較直觀),能夠肯定線程目前處於哪一個階段。而後看調用修飾及鎖狀況,基本就能夠肯定次線程是否有問題;

二、能夠短期(可能有問題的時間段)內屢次打印線程快照,而後查看可能有問題的某一線程在這幾回的狀況,能夠有效查找問題。

3、jps

相似Linux命令ps

參考 Java命令學習系列(一)——Jps

./jps

./jps -q

./jps -m

./jps -l

./jps -v

4、jmap

參考 Java命令學習系列(三)——Jmap

java命令--jmap命令使用

jmap -heap PID:堆使用狀況

jmap -histo PID:對象狀況

(jmap -histo:live 這個命令執行,JVM會先觸發gc,而後再統計信息

重點看項目上的類:[C是字符串數組,String用;[B是字節數組,網絡層用到。這兩個比較大通常不要緊

[C is a char[]

[S is a short[]

[I is a int[]

[B is a byte[]

[[I is a int[][]

技術在於學習 在於實踐 在於總結 在於分享 歡迎工做一到五年的Java工程師朋友們加入Java架構開發: 854393687 羣內提供免費的Java架構學習資料(裏面有高可用、高併發、高性能及分佈式、Jvm性能調優、Spring源碼,MyBatis,Netty,Redis,Kafka,Mysql,Zookeeper,Tomcat,Docker,Dubbo,Nginx等多個知識點的架構資料)合理利用本身每一分每一秒的時間來學習提高本身,不要再用"沒有時間「來掩飾本身思想上的懶惰!趁年輕,使勁拼,給將來的本身一個交代!

相關文章
相關標籤/搜索