玩轉Arthas

我的感覺

其實很早以前就據說過Arthas這個工具,只知道是在線診斷工具,也一直沒有去了解,該怎麼用?有啥用?據說好像很厲害?也一直停留在據說階段,不知道你們有沒有同感。可是在去年(2019)下半年的時候須要處理的生產環境問題愈來愈多,也愈來愈複雜,定位問題變得愈來愈繁瑣,總結起來遇到最多的問題就是如下幾點:html

  1. 爲何單元測試一樣的參數是能夠的,到了生產環境卻沒有返回值?是我沒有傳進去嗎?
  2. 爲何個人代碼感受沒生效?(是否是沒有發上去?仍是打包有問題?確定不是個人問題,個人代碼是最棒的的!)
  3. 爲何接口這麼慢啊?這方法幾百行我要一行一行加日誌打印時間(吐血...)?
  4. 怎麼感受這個沒有調用到個人方法呀?感受調用路徑不對?生產環境又不能debug!
  5. 爲何個人靜態變量獲取不到?值對不上?
  6. 程序死鎖了,是咋回事兒,哪裏鎖了?
  7. 內存佔用好高啊,想看一下dump日誌?
  8. ...

當我看到官網簡介的時候,嗯?!這不就是專門爲我準備的嗎?我決定玩兒一下,盤它!java

官網簡介

Arthas 是Alibaba開源的Java診斷工具,深受開發者喜好。git

當你遇到如下相似問題而一籌莫展時,Arthas能夠幫助你解決:github

  1. 這個類從哪一個 jar 包加載的?爲何會報各類類相關的 Exception?
  2. 我改的代碼爲何沒有執行到?難道是我沒 commit?分支搞錯了?
  3. 遇到問題沒法在線上 debug,難道只能經過加日誌再從新發布嗎?
  4. 線上遇到某個用戶的數據處理有問題,但線上一樣沒法 debug,線下沒法重現!
  5. 是否有一個全局視角來查看系統的運行情況?
  6. 有什麼辦法能夠監控到JVM的實時運行狀態?
  7. 怎麼快速定位應用的熱點,生成火焰圖?

Arthas支持JDK 6+,支持Linux/Mac/Winodws,採用命令行交互模式,同時提供豐富的 Tab 自動補全功能,進一步方便進行問題的定位和診斷。web

使用方式

Arthas的使用方式很是簡單spring

下載arthas-bin.zip

直接到github releases中下載本身想要的版本,arthas-bin.zip docker

在這裏插入圖片描述

找到arthas-boot.jar

解壓後能夠看到有不少jar包,咱們須要使用的就是arthas-boot.jar,由於我以前用過其餘版本因此我把它修改一下名字arthas-boot-3.3.6.jar 數組

在這裏插入圖片描述

模擬場景

你們能夠看到壓縮包中是有arthas-demo.jar的,可是demo裏面的場景比較少,因此我這邊本身模擬咱們常常遇到的場景,也方便咱們修改和調試。我這邊就拿我前兩天作Spring Boot 使用docker整合MongoDB的demo來用。模擬了最多見的一些場景,還原上面的幾個點。我這邊直接添加了一個Controller模擬了常規方法和死鎖,而後用Arthas來排查問題,首先須要啓動項目。瀏覽器

package com.example.mongo.controller;

import com.example.mongo.entity.UserEntity;
import com.example.mongo.service.UserService;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestBody;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.util.Arrays;
import java.util.List;
import java.util.Objects;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;

import javax.annotation.Resource;

import lombok.SneakyThrows;

@RestController
@RequestMapping("arthas")
public class ArthasController {

    private static ExecutorService executors = Executors.newFixedThreadPool(2);
    private static String NAME = "DW";

    @Resource
    private UserService userService;

    @SneakyThrows
    @GetMapping("normal")
    public List<String> normal( @RequestParam("param") Integer param ) {
        if (Objects.isNull(param)) throw new IllegalArgumentException("param is null");
        userService.findById(1L);
        return Arrays.asList("david", "david1");
    }

    @GetMapping("deadlock")
    public void deadlock() {
        UserEntity a = new UserEntity();
        UserEntity b = new UserEntity();
        executors.execute(() -> {
            synchronized (a) {
                System.out.println(Thread.currentThread().getName() + "get A lock! start sleep");
                NAME = Thread.currentThread().getName() + "1a";
                try {
                    Thread.sleep(1000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                System.out.println(Thread.currentThread().getName() + "sleep end start get B lock!");
                synchronized (b) {
                    NAME = Thread.currentThread().getName() + "1b";
                    System.out.println(Thread.currentThread().getName() + "get B lock!");
                }
            }

        });
        executors.execute(() -> {
            synchronized (b) {
                System.out.println(Thread.currentThread().getName() + "get B lock! start sleep");
                NAME = Thread.currentThread().getName() + "2b";
                try {
                    Thread.sleep(1000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                System.out.println(Thread.currentThread().getName() + "sleep end start get A lock!");
                synchronized (a) {
                    System.out.println(Thread.currentThread().getName() + "get A lock!");
                    NAME = Thread.currentThread().getName() + "2a";
                }
            }

        });

    }


}


// userService#findById
@Override
@SneakyThrows
public UserEntity findById( Long id ) {
    List<UserEntity> david = this.findByName("david");
    if (!CollectionUtils.isEmpty(david)) {
        david.forEach(System.out::println);
    }
    Thread.sleep(100);
    return userRepository.findById(id).orElse(new UserEntity());
}
複製代碼

啓動Arthas

  1. 啓動Arthas以後會出現進程列表,找到咱們的MongoApplication,編號爲6,輸入6回車,Arthas就啓動成功。
    在這裏插入圖片描述
  2. 能夠看到INFO日誌裏面有一句[INFO] arthas-client connect 127.0.0.1 3658由於咱們是本地調試因此能夠直接使用瀏覽器訪問localhost:3658,在web console中來操做,效果以下。

【Arthas官網】 默認狀況下,arthas只listen 127.0.0.1,因此若是想從遠程鏈接,則可使用 --target-ip參數指定listen的IP,更多參考-h的幫助說明。 注意會有安全風險,考慮下面的tunnel server的方案。安全

在這裏插入圖片描述

處理問題

1. 爲何單元測試一樣的參數是能夠的,到了生產環境卻沒有返回值?是我沒有傳進去嗎?

  • 這種場景下咱們可使用watch命令監控咱們的目標方法,查看入參,出參和異常信息。

  • 命令格式:watch <類的全限定名> <方法名> '{params, returnObj, throwExp}'

  • params若是是數組的話可使用params[0],params[1]來查看,returnObj表示返回值,throwExp表示異常信息,若是隻想看入參,只寫params信息就能夠,returnObjthrowExp也是同樣。輸入watch com.example.mongo.controller.ArthasController normal '{params, returnObj, throwExp}'回車即開始監控。

    在這裏插入圖片描述

  • 不傳參試一下http://localhost:8080/arthas/normal?param,報錯了,param is null

    在這裏插入圖片描述

  • 傳參http://localhost:8080/arthas/normal?param=1,入參出參都打印了,可是沒有具體值,修改一下命令,watch com.example.mongo.controller.ArthasController normal '{params[0], returnObj[0], returnObj[1], throwExp}'從新執行

    在這裏插入圖片描述

  • 修改命令以後效果以下:

    在這裏插入圖片描述

2. 我改的代碼爲何沒有執行到?難道是我沒 commit?分支搞錯了?

兩種辦法:

  1. 把咱們運行的jar包download下來反編譯
  2. Arthas

既然主要是講Arthas那確定是選擇Arthas啦,下次必定! 這裏須要使用到jad命令,直接對咱們的目標類或者目標方法進行反編譯查看。

  • 命令格式:jad <類的全限定名>/<類的全限定名> <方法名>
  • 輸入jad com.example.mongo.controller.ArthasController normal回車,便可查看正在運行的代碼究竟是什麼樣子,是美髮不上去呢,仍是寫bug,拒絕甩鍋。因爲類信息較長,就不截圖了輸入jad com.example.mongo.controller.ArthasController回車便可查看。
  1. 類加載器
  2. 地址
  3. 方法信息
    在這裏插入圖片描述

3. 爲何接口這麼慢啊?這方法幾百行我要一行一行加日誌打印時間(吐血...)?

  • trace 命令能主動搜索 class-pattern/method-pattern 對應的方法調用路徑,渲染和統計整個調用鏈路上的全部性能開銷和追蹤調用鏈路。
  • 命令格式:trace <類的全限定名> <方法名>
  • 輸入trace com.example.mongo.controller.ArthasController normal回車,能夠看到時間主要消耗在UserService#findById()
    在這裏插入圖片描述
    繼續追蹤trace com.example.mongo.service.UserService findById,能夠看到總耗時爲109ms,方法耗時綜合在9ms左右,Thread.sleep(100)不會打印,這個時候對比一下代碼就能夠鎖定具體問題了。
    在這裏插入圖片描述

4. 怎麼感受這個沒有調用到個人方法呀?感受調用路徑不對?生產環境又不能debug!

  • 不少時候咱們都知道一個方法被執行,但這個方法被執行的路徑很是多,或者你根本就不知道這個方法是從那裏被執行了,此時你須要的是 stack 命令。
  • 命令格式:stack <類的全限定名> <方法名>
  • 輸入stack com.example.mongo.controller.ArthasController normal
    在這裏插入圖片描述

5. 爲何個人靜態變量獲取不到?值對不上?

  • 經過getstatic命令能夠方便的查看類的靜態屬性。
  • 命令格式:getstatic <類的全限定名> <方法名>
  • 輸入getstatic com.example.mongo.controller.ArthasController NAME回車。
    在這裏插入圖片描述

6. 程序死鎖了,是咋回事兒,哪裏鎖了?

  • 訪問http://localhost:8080/arthas/deadlock復現死鎖,如今兩個線程相互等待對方釋放資源。
    在這裏插入圖片描述
  • 這裏咱們須要使用Thread命令來查看咱們的線程信息。能夠看到pool-1-thread-1pool-1-thread-2阻塞了,這也是爲何建議你們在使用線程池的時候必定要命名的緣由,前面線程池的blog有詳細講解。傳送門Davids原理探究:ThreadPoolExecutor原理
    在這裏插入圖片描述
  • 咱們看一下命名以後的效果,一目瞭然。
    在這裏插入圖片描述
  • 還可使用thread -b直接查看block狀態的線程信息,鎖定緣由。
    在這裏插入圖片描述
  • 還可使用thread -n <num>查看cpu使用率最高的num個線程用於排查cpu佔用高的場景,相關信息也很是詳細。
    在這裏插入圖片描述

7. 內存佔用好高啊,想看一下dump日誌?

通常在配置JVM的時候建議打開dump日誌,一旦出現內存溢出方便排查,可是在內存達到報警閾值或者內存在某個版本發佈以後長期處於高佔用狀態的時候,咱們能夠採用Arthas進行heapdump分析緣由(相似jmap命令的heap dump功能)。

命令格式:

  • dump到指定文件heapdump <path> 示例:heapdump /tmp/dump.hprof
  • 只dump live對象heapdump --live <path> 示例:heapdump --live /tmp/dump.hprof
  • dump到臨時文件heapdump 示例:heapdump
    在這裏插入圖片描述
    查看dump文件生成成功,因爲篇幅緣由,如何排查dump後面再專門作一篇blog。
    在這裏插入圖片描述

總結

其實Arthas還有很是多的豐富的功能,本篇博客只是介紹了一些很是基礎和我經常使用的,並且這些命令還有不少高級用法,你們感興趣的能夠去玩一玩。官網傳送門

相關文章
相關標籤/搜索