一次線上死循環的排查

時間 2019-12-07

標籤一次線上循環排查简体版

原文原文鏈接

一、問題發現

Prometheus報警某服務的一個節點 Old GC過多，須要排查。java

二、查看GC日誌

      使用tail -f gc.log命令查看異常節點的GC日誌，從日誌能夠看出Young GC過於頻繁，居然在1s內有9次Young GC：

      使用tail -f gc.log命令查看正常節點的GC日誌，從日誌能夠看出，正常節點，好久才進行一次Young GC：

      兩個節點的JVM參數配置是徹底同樣的，而且負載均衡策略使用的是Ribbon默認的輪詢策略，也就是說，兩個節點可以接受到的請求是均衡的，不存在一個節點比另外一個階段負載大的狀況。
      使用jstat命令查看異常節點的Young GC頻率，發現確實存在異常：
負載均衡

三、使用`jps`命令找出該應用進程的pid，再使用`top -Hp pid`命令查看該進程下佔用CPU最多的線程id：

四、將查到的線程id 9182，使用`printf "%x\n" 9182`命令，轉換爲16進制：

五、使用`jstack 9088 | grep 23de -A 30`命令查看堆棧信息（屢次查看）：

      第一次：

      第二次：

      該線程一直處於Running狀態，而且兩次查看中發現，堆棧中有共同的方法調用，懷疑問題可能發生在RedPackUtilV3.java:169處，須要查看業務同窗代碼。線程

六、查看業務同窗代碼

發現極有多是while循環中break條件一直沒成立，致使了死循環，最後就請業務同窗本身檢查代碼邏輯了。3d

相關文章

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<