愛生活,愛編碼,微信搜一搜【架構技術專欄】關注這個喜歡分享的地方。
本文 架構技術專欄 已收錄,有各類圖文資料以及技術文章。java
每當線上應用出現各類吞吐降低、RT增加、CPU飈高、內存溢出等問題的時候是否是腦闊疼。面對出現的問題,簡直就是無從下口啊。mongodb
不要慌,其實對於線上出現的各類奇葩問題,咱們使用ThreadDump就能解決90%了。微信
不少時候根本不須要對JVM參數進行各類複雜的調優,好好看看線程棧,優化優化你的代碼,簡直就是美滋滋的提高性能。網絡
好了,言歸正傳,下面咱們就來講下線程棧重點關注的點來協助咱們進行問題的排查。架構
之前你們接觸到的線程狀態是:BLOCKED、WAITING、TIMED_WAITING、RUNABLE,今天咱們換個說法來看,到底什麼樣的線程會出現這種狀態。socket
爲了減小篇幅,線程棧的基本概念就不在這裏重複了,有興趣的能夠看之前的文章 ThreadDump分析實戰 。性能
一、線程狀態爲「waiting for monitor entry」:優化
含義: 意味着它 在等待進入一個臨界區 ,因此它在」Entry Set「隊列中等待。編碼
此時狀態: BLOCKED.net
舉例: java.lang.Thread.State: BLOCKED (on object monitor)
知識點:注意 "Entry Set" 就是我們平時常用synchronized 的時候線程所等待的區域
2,若是大量線程在 「waiting for monitor entry」:
含義:多是一個全局鎖阻塞住了大量線程,若是短期內屢次打印的 thread dump 文件反映,隨着時間流逝,waiting for monitor entry 的線程愈來愈多,沒有減小的趨勢,可能意味着某些線程在臨界區裏呆的時間太長了,以致於愈來愈多新線程遲遲沒法進入臨界區。
此時狀態:BLOCKED
三、線程狀態爲「waiting on condition」:
含義: 它在等待另外一個條件的發生,來把本身喚醒,或者是它是調用了 sleep(N)。
此時狀態:WAITING || TIMED_WAITING
舉例:
java.lang.Thread.State: WAITING (parking):一直等某個條件發生
java.lang.Thread.State: TIMED_WAITING (parking或sleeping):設有超時時間,那個條件不到來,也將定時喚醒本身。
4,若是大量線程在「waiting on condition」:
含義: 多是它們又跑去獲取第三方資源,尤爲是第三方網絡資源,遲遲獲取不到Response,致使大量線程進入等待狀態。
因此若是你發現有大量的線程都處在 Wait on condition,從線程堆棧看,正等待網絡讀寫,這多是一個網絡瓶頸的徵兆,由於網絡阻塞致使線程沒法執行。
此時狀態:WAITING || TIMED_WAITING
五、線程狀態爲「in Object.wait()」:
含義:說明它得到了監視器以後(也就是開始執行synchronized的方法),又調用了 java.lang.Object.wait() 方法。
每一個 Monitor在某個時刻,只能被一個線程擁有,該線程就是 「Active Thread」,而其它線程都是 「Waiting Thread」,分別在兩個隊列 「 Entry Set」和 「Wait Set」裏面等候。在 「Entry Set」中等待的線程狀態是 「Waiting for monitor entry」,而在 「Wait Set」中等待的線程狀態是 「in Object.wait()」。
當線程得到了 Monitor,若是發現線程繼續運行的條件沒有知足,它則調用對象(通常就是被 synchronized 的對象)的 wait() 方法,放棄了 Monitor,進入 「Wait Set」隊列。
此時狀態:TIMED_WAITING || WAITING
舉例:
知識點:通常都是RMI相關線程(RMI RenewClean、 GC Daemon、RMI Reaper),GC線程(Finalizer),引用對象垃圾回收線程(Reference Handler)等系統線程處於這種狀態,如圖。
光說確定是乾巴巴的,下面咱們來看幾個小樣,幫助你們消化消化。
狀態:waiting for monitor entry BLOCKED 緣由:這個線程在等待這個鎖 0x00000000fe7exx61,等待進入臨界區: "RMI TCP Connection(12345)-xxx.52.xxx" daemon prio=10 tid=0x00000000405a6000 nid=0x68fe waiting for monitor entry [0x00007f2be65a3000] java.lang.Thread.State: BLOCKED (on object monitor) at com.xyz.goods.service.impl.GoodsServiceImpl.findChanellGoodsCountWithCache(GoodsServiceImpl.java:1734) - waiting to lock <0x00000000fe7exx61> (a java.lang.String) 那麼當前誰持有這個鎖呢? 在線程棧中搜索0x00000000fe7exx61,咱們會發現另外一個線程調用了 - locked <0x00000000fe7exx61> 對現場進行了加鎖 "RMI TCP Connection(64878)-172.16.52.117" daemon prio=10 tid=0x0000000040822000 nid=0x6841 runnable [0x00007f2be76b3000] java.lang.Thread.State: RUNNABLE at java.net.SocketInputStream.socketRead0(Native Method) at java.net.SocketInputStream.read(SocketInputStream.java:129) at java.io.BufferedInputStream.fill(BufferedInputStream.java:218) at java.io.BufferedInputStream.read1(BufferedInputStream.java:258) at java.io.BufferedInputStream.read(BufferedInputStream.java:317) - locked <0x00000000af4ed638> (a java.io.BufferedInputStream) at org.bson.io.Bits.readFully(Bits.java:35) at org.bson.io.Bits.readFully(Bits.java:28) at com.mongodb.Response.<init>(Response.java:35) at com.mongodb.DBPort.go(DBPort.java:110) - locked <0x00000000af442d48> (a com.mongodb.DBPort) at com.mongodb.DBPort.go(DBPort.java:75) - locked <0x00000000af442d48> (a com.mongodb.DBPort) at com.mongodb.DBPort.call(DBPort.java:65) at com.mongodb.DBTCPConnector.call(DBTCPConnector.java:202) at com.mongodb.DBApiLayer$MyCollection.__find(DBApiLayer.java:296) at com.mongodb.DB.command(DB.java:152) at com.mongodb.DBCollection.getCount(DBCollection.java:760) at com.mongodb.DBCollection.getCount(DBCollection.java:731) at com.mongodb.DBCollection.count(DBCollection.java:697) at com.xyz.goods.manager.MongodbManager.count(MongodbManager.java:202) at com.xyz.goods.service.impl.GoodsServiceImpl.findChanellGoodsCount(GoodsServiceImpl.java:1787) at com.xyz.goods.service.impl.GoodsServiceImpl.findChanellGoodsCountWithCache(GoodsServiceImpl.java:1739) - locked <0x00000000fe7exx61> (a java.lang.String)
狀態: waiting on condition [0x00007fd4f1a59000] TIMED_WAITING 緣由:等待另外一個條件發生來將本身喚醒: "RMI TCP Connection(idle)" daemon prio=10 tid=0x00007fd50834e800 nid=0x56b2 waiting on condition [0x00007fd4f1a59000] java.lang.Thread.State: TIMED_WAITING (parking) at sun.misc.Unsafe.park(Native Method) - parking to wait for <0x00000000acd84de8> (a java.util.concurrent.SynchronousQueue$TransferStack) at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:198) at java.util.concurrent.SynchronousQueue$TransferStack.awaitFulfill(SynchronousQueue.java:424) at java.util.concurrent.SynchronousQueue$TransferStack.transfer(SynchronousQueue.java:323) at java.util.concurrent.SynchronousQueue.poll(SynchronousQueue.java:874) at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:945) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:907) at java.lang.Thread.run(Thread.java:662) 1)「TIMED_WAITING (parking)」中的 timed_waiting 指等待狀態,但這裏指定了時間,到達指定的時間後自動退出等待狀態;parking指線程處於掛起中。 2)狀態「waiting on condition」 須要與堆棧中的「parking to wait for <0x00000000acd84de8> (a java.util.concurrent.SynchronousQueue$TransferStack)」 這一行結合來看。此時線程確定是在等待某個條件的發生,來把本身喚醒。其次,SynchronousQueue 並非一個隊列,只是線程之間移交信息的機制,當咱們把一個元素放入到 SynchronousQueue 中時必須有另外一個線程正在等待接受移交的任務,所以這就是本線程在等待的條件,通常是在等待任務的出現。
狀態: TIMED_WAITING in Object.wait() 緣由:就是線程主動掛起,在等待某一條件喚醒 "RMI RenewClean-[172.16.50.182:4888]" daemon prio=10 tid=0x0000000040d2c800 nid=0x97e in Object.wait() [0x00007f9ccafd0000] java.lang.Thread.State: TIMED_WAITING (on object monitor) at java.lang.Object.wait(Native Method) - waiting on <0x0000000799b032d8> (a java.lang.ref.ReferenceQueue$Lock) at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118) - locked <0x0000000799b032d8> (a java.lang.ref.ReferenceQueue$Lock) at sun.rmi.transport.DGCClient$EndpointEntry$RenewCleanThread.run(DGCClient.java:516) at java.lang.Thread.run(Thread.java:662)
綜上所述,就是線程棧給咱們帶來的信息。固然不只僅只有這些,但線程的狀態變化是咱們分析應用問題的必要基礎。其實分析這玩意真沒什麼技巧,大概的概念搞懂以後就是惟手熟爾咯。
愛生活,愛編碼,微信搜一搜【架構技術專欄】關注這個喜歡分享的地方。
本文 架構技術專欄 已收錄,有各類圖文資料以及技術文章。