利用Arthas定位線上問題實例

前言

Arthas是一個相似於Btrace的JVM在線調試分析工具,具體可參考我以前寫的一篇博客:利用JVM在線調試工具排查線上問題。本文分享筆者剛遇到的一個問題,雖然不復雜,可是很典型。java

問題與分析過程

昨天上線遇到一個問題,交易後給大數據平臺異步送數,可是他們說沒收到數據,由於咱們沒有打日誌,因此沒有直接的證據證實是他們的問題而不是咱們的問題。json

送數的原理大體以下,就是交易主線程把數據放到隊列裏,而後異步線程從隊列裏把數據取出來,發送到後臺。app

隊列:
BlockingQueue<Message> queue = new BlockingQueue();

同步線程:
void sendMsg(Message msg) {
   queue.offer(msg);
}
異步線程:
void consume() {
   Message msg = queue.take();
   while(msg != null) {
       HttpClient.post(msg);
       msg = queue.take();
   }
}

具體送數的代碼以下( 加了行數):異步

38  public void consume(Map msg) {
39        HttpClient httpClient = new HttpClient(cm);
40        PostMethod method = new PostMethod(uri);
41        method.addRequestHeader("context-type", "application/x-www-form-urlencoded");
42        JSONObject json = new JSONObject(msg);
43       NameValuePair[] params = new NameValuePair[2];
44       params[0] = new NameValuePair("topic", topic);
45       params[1] = new NameValuePair("value", json.toJSONString());
46       //System.out.println(msg.toString());
47       logger.info("BigDataHttp Send Json:" + json.toJSONString());
48       method.addParameters(params);
49      try {
50
51         httpClient.executeMethod(method);
52         if(method.getStatusCode() == 200) {
53              logger.info("BigDataHttp response(Success):"+ method.getResponseBodyAsString());
54         } else {
55              logger.info("BigDataHttp Response(error):" + method.getResponseBodyAsString());
56         }
57     } catch(Exception e) {
58         logger.error(e.getMessage(), e);
59     } finally {
60         method.releaseConnection();
61     }
62  }

在日誌裏沒有發現try裏的異常,而比較遺憾的是,咱們的日誌雖然開了info級別,可是由於日誌量太大,因此只開了交易上送和下發報文的日誌,其餘的日誌都關了。ide

如今日誌級別無法調,有沒有辦法能肯定,請求返回了200,仍是其餘值呢?工具

能夠用在線調試工具Arthas,咱們使用Arthas的trace功能,查看這個類執行的詳細步驟。post

首先鏈接上這個JVM進程,pid爲進程號。大數據

java -jar arthas-boot.jar pid

而後執行命令url

trace xxx.util.bigDataUtil.BigDataHttpConsumer consume

這條命令的左右就是,追蹤xxx.util.bigDataUtil.BigDataHttpConsumer類裏consume方法的執行過程。線程

執行的結果以下,每一行最後的是代碼行數,咱們能夠看一下,跟上面代碼是一一對應的。
利用Arthas定位線上問題實例

從代碼中能夠看到,若是返回碼是200,那麼它會執行第52行,若是返回碼不是200,會執行55行,所以,咱們經過trace功能肯定執行了哪條語句,就能夠知道到底返回沒返回200,從結果來看,肯定返回的不是200。

這樣咱們就有了肯定的證據證實發給後臺時返回非200,後臺同事檢查了本身的配置發現配置有誤,是他們本身的問題。

相關文章
相關標籤/搜索