6. GC 調優(工具篇) - GC參考手冊

時間 2019-11-13

標籤工具欄目 Java 简体版

原文原文鏈接

進行GC性能調優時, 需要明白瞭解, 當前的GC行爲對系統和用戶有多大的影響。html

有多種監控GC的工具和方法, 本章將逐一介紹常用的工具。java

您應該已經閱讀了前面的章節:git

JVM 在程序執行的過程當中, 提供了GC行爲的原生數據。github

那麼, 咱們就可以利用這些原生數據來生成各類報告。原生數據(raw data) 包含:算法

各個內存池的當前使用狀況,
各個內存池的總容量,
每次GC暫停的持續時間,
GC暫停在各個階段的持續時間。

可以經過這些數據算出各類指標, 好比: 程序的內存分配率, 提高率等等。本章主要介紹怎樣獲取原生數據。興許的章節將對重要的派生指標(derived metrics)展開討論, 並引入GC性能相關的話題。小程序

JMX API

從 JVM 執行時獲取GC行爲數據, 最簡單的辦法是使用標準 JMX API 接口. JMX是獲取 JVM內部執行時狀態信息的標準API. 可以編敲代碼代碼, 經過 JMX API 來訪問本程序所在的JVM，也可以經過JMXclient執行(遠程)訪問。api

最多見的 JMXclient是 JConsole 和 JVisualVM (可以安裝各類插件,十分強大)。兩個工具都是標準JDK的一部分, 而且很是easy使用. 假設使用的是 JDK 7u40 及更高版本號, 還可以使用還有一個工具: Java Mission Control( 大體翻譯爲 Java控制中心, jmc.exe)。數組

JVisualVM安裝MBeans插件的步驟: 經過工具(T) – 插件(G) – 可用插件 – 勾選VisualVM-MBeans – 安裝 – 下一步 – 等待安裝完畢…… 其它插件的安裝過程基本一致。markdown

所有 JMXclient都是獨立的程序,可以鏈接到目標JVM上。目標JVM可以在本機, 也多是遠端JVM. 假設要鏈接遠端JVM, 則目標JVM啓動時必須指定特定的環境變量,以開啓遠程JMX鏈接/以及端口號。示比例如如下:併發

java -Dcom.sun.management.jmxremote.port=5432 com.yourcompany.YourApp

在此處, JVM 打開端口5432以支持JMX鏈接。

經過 JVisualVM 鏈接到某個JVM之後, 切換到 MBeans 標籤, 展開「java.lang/GarbageCollector」 . 就可以看到GC行爲信息, 下圖是 JVisualVM 中的截圖:

下圖是Java Mission Control 中的截圖:

從以上截圖中可以看到兩款垃圾收集器。

當中一款負責清理年輕代(PS Scavenge)，還有一款負責清理老年代(PS MarkSweep); 列表中顯示的就是垃圾收集器的名稱。

可以看到 , jmc 的功能和展現數據的方式更強大。

對所有的垃圾收集器, 經過 JMX API 獲取的信息包含:

CollectionCount : 垃圾收集器執行的GC總次數,
CollectionTime: 收集器執行時間的累計。這個值等於所有GC事件持續時間的總和,
LastGcInfo: 近期一次GC事件的具體信息。包含 GC事件的持續時間(duration), 開始時間(startTime) 和結束時間(endTime), 以及各個內存池在近期一次GC以前和以後的使用狀況,
MemoryPoolNames: 各個內存池的名稱,
Name: 垃圾收集器的名稱
ObjectName: 由JMX規範定義的 MBean的名字,,
Valid: 此收集器是否有效。本人僅僅見過「true「的狀況 (^_^)

依據經驗, 這些信息對GC的性能來講,不能得出什麼結論. 僅僅有編敲代碼, 獲取GC相關的 JMX 信息來進行統計和分析。

在下文可以看到, 通常也不怎麼關注 MBean , 但 MBean 對於理解GC的原理卻是挺實用的。

JVisualVM

JVisualVM 工具的「VisualGC」插件提供了主要的 JMXclient功能, 還實時顯示出 GC事件以及各個內存空間的使用狀況。

Visual GC 插件常用來監控本機執行的Java程序, 比方開發人員和性能調優專家常常會使用此插件, 以高速獲取程序執行時的GC信息。

左側的圖表展現了各個內存池的使用狀況: Metaspace/永久代, 老年代, Eden區以及兩個存活區。

在右邊, 頂部的兩個圖表與 GC無關, 顯示的是 JIT編譯時間和類載入時間。

如下的6個圖顯示的是內存池的歷史記錄, 每個內存池的GC次數,GC總時間, 以及最大值。峯值, 當前使用狀況。

再如下是 HistoGram, 顯示了年輕代對象的年齡分佈。至於對象的年齡監控(objects tenuring monitoring), 本章不進行解說。

與純粹的JMX工具相比, VisualGC 插件提供了更友好的界面, 假設沒有其它趁手的工具, 請選擇VisualGC. 本章接下來會介紹其它工具, 這些工具可以提供不少其它的信息, 以及更好的視角. 固然, 在「Profilers(分析器)」一節中，也會介紹 JVisualVM 的適用場景 —— 如: 分配分析(allocation profiling), 因此咱們毫不會貶低哪一款工具, 關鍵還得看實際狀況。

jstat

jstat 也是標準JDK提供的一款監控工具(Java Virtual Machine statistics monitoring tool),可以統計各類指標。既可以鏈接到本地JVM,也可以連到遠程JVM. 查看支持的指標和相應選項可以執行「jstat -options」。

好比:

+-----------------+---------------------------------------------------------------+
|     Option      |                          Displays...                          |
+-----------------+---------------------------------------------------------------+
|class            | Statistics on the behavior of the class loader                |
|compiler         | Statistics  on  the behavior of the HotSpot Just-In-Time com- |
|                 | piler                                                         |
|gc               | Statistics on the behavior of the garbage collected heap      |
|gccapacity       | Statistics of the capacities of  the  generations  and  their |
|                 | corresponding spaces.                                         |
|gccause          | Summary  of  garbage collection statistics (same as -gcutil), |
|                 | with the cause  of  the  last  and  current  (if  applicable) |
|                 | garbage collection events.                                    |
|gcnew            | Statistics of the behavior of the new generation.             |
|gcnewcapacity    | Statistics of the sizes of the new generations and its corre- |
|                 | sponding spaces.                                              |
|gcold            | Statistics of the behavior of the old and  permanent  genera- |
|                 | tions.                                                        |
|gcoldcapacity    | Statistics of the sizes of the old generation.                |
|gcpermcapacity   | Statistics of the sizes of the permanent generation.          |
|gcutil           | Summary of garbage collection statistics.                     |
|printcompilation | Summary of garbage collection statistics.                     |
+-----------------+---------------------------------------------------------------+

jstat 對於高速肯定GC行爲是否健康很是實用。啓動方式爲: 「jstat -gc -t PID 1s」 , 當中,PID 就是要監視的Java進程ID。可以經過 jps 命令查看正在執行的Java進程列表。

jps

jstat -gc -t 2428 1s

以上命令的結果, 是 jstat 每秒向標準輸出輸出一行新內容, 比方:

Timestamp  S0C    S1C    S0U    S1U      EC       EU        OC         OU       MC     MU    CCSC   CCSU   YGC     YGCT    FGC    FGCT     GCT   
200.0    8448.0 8448.0 8448.0  0.0   67712.0  67712.0   169344.0   169344.0  21248.0 20534.3 3072.0 2807.7     34    0.720  658   133.684  134.404
201.0    8448.0 8448.0 8448.0  0.0   67712.0  67712.0   169344.0   169343.2  21248.0 20534.3 3072.0 2807.7     34    0.720  662   134.712  135.432
202.0    8448.0 8448.0 8102.5  0.0   67712.0  67598.5   169344.0   169343.6  21248.0 20534.3 3072.0 2807.7     34    0.720  667   135.840  136.559
203.0    8448.0 8448.0 8126.3  0.0   67712.0  67702.2   169344.0   169343.6  21248.0 20547.2 3072.0 2807.7     34    0.720  669   136.178  136.898
204.0    8448.0 8448.0 8126.3  0.0   67712.0  67702.2   169344.0   169343.6  21248.0 20547.2 3072.0 2807.7     34    0.720  669   136.178  136.898
205.0    8448.0 8448.0 8134.6  0.0   67712.0  67712.0   169344.0   169343.5  21248.0 20547.2 3072.0 2807.7     34    0.720  671   136.234  136.954
206.0    8448.0 8448.0 8134.6  0.0   67712.0  67712.0   169344.0   169343.5  21248.0 20547.2 3072.0 2807.7     34    0.720  671   136.234  136.954
207.0    8448.0 8448.0 8154.8  0.0   67712.0  67712.0   169344.0   169343.5  21248.0 20547.2 3072.0 2807.7     34    0.720  673   136.289  137.009
208.0    8448.0 8448.0 8154.8  0.0   67712.0  67712.0   169344.0   169343.5  21248.0 20547.2 3072.0 2807.7     34    0.720  673   136.289  137.009

略微解釋一下上面的內容。參考 jstat manpage , 咱們可以知道:

jstat 鏈接到 JVM 的時間, 是JVM啓動後的 200秒。此信息從第一行的「Timestamp」列得知。繼續看下一行, jstat 每秒鐘從JVM 接收一次信息, 也就是命令行參數中「1s」的含義。
從第一行的「YGC」列得知年輕代共執行了34次GC, 由「FGC」列得知整個堆內存已經執行了 658次 full GC。
年輕代的GC耗時總共爲 0.720 秒, 顯示在「YGCT」這一列。
Full GC 的總計耗時爲 133.684 秒, 由「FGCT」列得知。
這馬上就吸引了咱們的目光, 總的JVM 執行時間僅僅有 200 秒, 但當中有 66% 的部分被 Full GC 消耗了。

再看下一行, 問題就更明顯了。

在接下來的一秒內共執行了 4 次 Full GC。參見「FGC」列.
這4次 Full GC 暫停佔用了差點兒相同 1秒的時間(依據 FGCT列的差得知)。與第一行相比, Full GC 耗費了928 毫秒, 即 92.8% 的時間。
依據「OC 和「OU」列得知, 整個老年代的空間爲 169,344.0 KB (「OC「), 在 4 次 Full GC 後依舊佔用了 169,344.2 KB (「OU「)。用了 928ms 的時間卻僅僅釋放了 800 字節的內存, 怎麼看都以爲很是不正常。

僅僅看這兩行的內容, 就知道程序出了很是嚴重的問題。

繼續分析下一行, 可以肯定問題依舊存在,而且變得更糟。

JVM差點兒全然卡住了(stalled), 因爲GC佔用了90%以上的計算資源。GC以後, 所有的老代空間仍然還在佔用。其實, 程序在一分鐘之後就掛了, 拋出了「java.lang.OutOfMemoryError: GC overhead limit exceeded」錯誤。

可以看到, 經過 jstat 能很是快發現對JVM健康極爲不利的GC行爲。通常來講, 僅僅看 jstat 的輸出就能高速發現如下問題:

最後一列「GCT」, 與JVM的總執行時間「Timestamp」的比值, 就是GC 的開銷。假設每一秒內, 「GCT」的值都會明顯增大, 與總執行時間相比, 就暴露出GC開銷過大的問題. 不一樣系統對GC開銷有不一樣的容忍度, 由性能需求決定, 通常來說, 超過 10% 的GC開銷都是有問題的。
「YGC」和「FGC」列的高速變化每每也是有問題的徵兆。
頻繁的GC暫停會累積,並致使不少其它的線程停頓(stop-the-world pauses), 進而影響吞吐量。
假設看到「OU」列中,老年代的使用量約等於老年代的最大容量(OC), 而且不下降的話, 就表示儘管執行了老年代GC, 但基本上屬於無效GC。

GC日誌(GC logs)

經過日誌內容也可以獲得GC相關的信息。

因爲GC日誌模塊內置於JVM中, 因此日誌中包含了對GC活動最全面的描寫敘述。

這就是其實的標準, 可做爲GC性能評估和優化的最真實數據來源。

GC日誌通常輸出到文件之中, 是純 text 格式的, 固然也可以打印到控制檯。有多個可以控制GC日誌的JVM參數。

好比,可以打印每次GC的持續時間, 以及程序暫停時間(-XX:+PrintGCApplicationStoppedTime), 還有GC清理了多少引用類型(-XX:+PrintReferenceGC)。

要打印GC日誌, 需要在啓動腳本中指定如下參數:

-XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintGCDetails -Xloggc:<filename>

以上參數指示JVM: 將所有GC事件打印到日誌文件裏, 輸出每次GC的日期和時間戳。

不一樣GC算法輸出的內容略有不一樣. ParallelGC 輸出的日誌類似這樣:

199.879: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1473386 secs] [Times: user=0.43 sys=0.01, real=0.15 secs]
200.027: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1567794 secs] [Times: user=0.41 sys=0.00, real=0.16 secs]
200.184: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1621946 secs] [Times: user=0.43 sys=0.00, real=0.16 secs]
200.346: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1547695 secs] [Times: user=0.41 sys=0.00, real=0.15 secs]
200.502: [Full GC (Ergonomics) [PSYoungGen: 64000K->63999K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1563071 secs] [Times: user=0.42 sys=0.01, real=0.16 secs]
200.659: [Full GC (Ergonomics) [PSYoungGen: 64000K->63999K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1538778 secs] [Times: user=0.42 sys=0.00, real=0.16 secs]

在「04. GC算法:實現篇」中具體介紹了這些格式, 假設對此不瞭解, 可以先閱讀該章節。

分析以上日誌內容, 可以得知:

這部分日誌截取自JVM啓動後200秒左右。
日誌片斷中顯示, 在780毫秒之內, 因爲垃圾回收致使了5次 Full GC 暫停(去掉第六次暫停,這樣更精確一些)。
這些暫停事件的總持續時間是 777毫秒, 佔總執行時間的 99.6%。
在GC完畢以後, 差點兒所有的老年代空間(169,472 KB)依舊被佔用(169,318 KB)。

經過日誌信息可以肯定, 該應用的GC狀況很是糟糕。JVM差點兒全然停滯, 因爲GC佔用了超過99%的CPU時間。而GC的結果是, 老年代空間仍然被佔滿, 這進一步確定了咱們的結論。

演示樣例程序和jstat 小節中的是同一個, 幾分鐘以後系統就掛了, 拋出「java.lang.OutOfMemoryError: GC overhead limit exceeded」錯誤, 不用說, 問題是很是嚴重的.

今後演示樣例可以看出, GC日誌對監控GC行爲和JVM是否處於健康狀態很是實用。

普通狀況下, 查看 GC 日誌就可以高速肯定如下症狀:

GC開銷太大。
假設GC暫停的總時間很是長, 就會損害系統的吞吐量。不一樣的系統贊成不一樣比例的GC開銷, 但通常以爲, 正常範圍在 10% 之內。
極個別的GC事件暫停時間過長。
當某次GC暫停時間太長, 就會影響系統的延遲指標. 假設延遲指標規定交易必須在 1,000 ms內完畢, 那就不能容忍不論什麼超過 1000毫秒的GC暫停。
老年代的使用量超過限制。假設老年代空間在 Full GC 以後仍然接近全滿, 那麼GC就成爲了性能瓶頸, 多是內存過小, 也多是存在內存泄漏。這種症狀會讓GC的開銷暴增。

可以看到,GC日誌中的信息很是具體。但除了這些簡單的小程序, 生產系統通常都會生成大量的GC日誌, 純靠人工是很是難閱讀和進行解析的。

GCViewer

咱們可以本身編寫解析器, 來將龐大的GC日誌解析爲直觀易讀的圖形信息。但很是多時候本身敲代碼也不是個好辦法, 因爲各類GC算法的複雜性, 致使日誌信息格式互相之間不太兼容。那麼神器來了: GCViewer。

GCViewer 是一款開源的GC日誌分析工具。項目的 GitHub 主頁對各項指標進行了完整的描寫敘述. 如下咱們介紹最常用的一些指標。

第一步是獲取GC日誌文件。這些日誌文件要可以反映系統在性能調優時的具體場景. 倘若運營部門(operational department)反饋: 每週五下午,系統就執行緩慢, 不管GC是否是主要緣由, 分析週一早晨的日誌是沒有多少意義的。

獲取到日誌文件以後, 就可以用 GCViewer 進行分析, 大體會看到類似如下的圖形界面:

使用的命令行大體例如如下:

java -jar gcviewer_1.3.4.jar gc.log

固然, 假設不想打開程序界面,也可以在後面加上其它參數,直接將分析結果輸出到文件。

命令大體例如如下:

java -jar gcviewer_1.3.4.jar gc.log summary.csv chart.png

以上命令將信息彙總到當前文件夾下的 Excel 文件 summary.csv 之中, 將圖形信息保存爲 chart.png 文件。

點擊下載: gcviewer的jar包及使用演示樣例。

上圖中, Chart 區域是對GC事件的圖形化展現。包含各個內存池的大小和GC事件。上圖中, 僅僅有兩個可視化指標: 藍色線條表示堆內存的使用狀況, 黑色的Bar則表示每次GC暫停時間的長短。

從圖中可以看到, 內存使用量增加很是快。一分鐘左右就達到了堆內存的最大值. 堆內存差點兒所有被消耗, 不能順利分配新對象, 並引起頻繁的 Full GC 事件. 這說明程序可能存在內存泄露, 或者啓動時指定的內存空間不足。

從圖中還可以看到 GC暫停的頻率和持續時間。30秒以後, GC差點兒不間斷地執行,最長的暫停時間超過1.4秒。

在右邊有三個選項卡。

「Summary(摘要)」中比較實用的是「Throughput」(吞吐量百分比) 和「Number of GC pauses」(GC暫停的次數), 以及「Number of full GC pauses」(Full GC 暫停的次數). 吞吐量顯示了有效工做的時間比例, 剩下的部分就是GC的消耗。

以上演示樣例中的吞吐量爲 6.28%。

這意味着有 93.72% 的CPU時間用在了GC上面. 很是明顯系統所面臨的狀況很是糟糕 —— 寶貴的CPU時間沒實用於執行實際工做, 而是在試圖清理垃圾。

下一個有意思的地方是「Pause」(暫停)選項卡:

「Pause」展現了GC暫停的總時間,平均值,最小值和最大值, 而且將 total 與minor/major 暫停分開統計。假設要優化程序的延遲指標, 這些統計可以很是快推斷出暫停時間是否過長。另外, 咱們可以得出明白的信息: 累計暫停時間爲 634.59 秒, GC暫停的總次數爲 3,938 次, 這在11分鐘/660秒的總執行時間裏那不是通常的高。

更具體的GC暫停彙總信息, 請查看主界面中的「Event details」標籤:

從「Event details」標籤中, 可以看到日誌中所有重要的GC事件彙總: 普通GC停頓 和 Full GC 停頓次數, 以及併發執行數, 非 stop-the-world 事件等。此演示樣例中, 可以看到一個明顯的地方, Full GC 暫停嚴重影響了吞吐量和延遲, 依據是: 3,928 次 Full GC, 暫停了634秒。

可以看到, GCViewer 能用圖形界面高速展示異常的GC行爲。通常來講, 圖像化信息能迅速揭示如下症狀:

低吞吐量。當應用的吞吐量降低到不能容忍的地步時, 實用工做的總時間就大量下降. 具體有多大的「容忍度」(tolerable) 取決於具體場景。
依照經驗, 低於 90% 的有效時間就值得警戒了, 可能需要好好優化下GC。
單次GC的暫停時間過長。僅僅要有一次GC停頓時間過長,就會影響程序的延遲指標. 好比, 延遲需求規定必須在 1000 ms之內完畢交易, 那就不能容忍不論什麼一次GC暫停超過1000毫秒。
堆內存使用率太高。
假設老年代空間在 Full GC 以後仍然接近全滿, 程序性能就會大幅下降, 多是資源不足或者內存泄漏。
這種症狀會對吞吐量產生嚴重影響。

業界良心 —— 圖形化展現的GC日誌信息絕對是咱們重磅推薦的。

不用去閱讀冗長而又複雜的GC日誌,經過easy理解的圖形, 也可以獲得相同的信息。

分析器(Profilers)

如下介紹分析器(profilers, Oracle官方翻譯是:抽樣器)。相對於前面的工具, 分析器僅僅關心GC中的一部分領域. 本節咱們也僅僅關注分析器相關的GC功能。

首先警告 —— 不要以爲分析器適用於所有的場景。分析器有時確實做用很是大, 比方檢測代碼中的CPU熱點時。但某些狀況使用分析器不必定是個好方案。

對GC調優來講也是同樣的。要檢測是否因爲GC而引發延遲或吞吐量問題時, 不需要使用分析器. 前面提到的工具( jstat 或原生/可視化GC日誌)就能更好更快地檢測出是否存在GC問題. 特別是從生產環境中收集性能數據時, 最好不要使用分析器, 因爲性能開銷很是大。

假設確實需要對GC進行優化, 那麼分析器就可以派上用場了, 可以對 Object 的建立信息一目瞭然. 換個角度看, 假設GC暫停的緣由不在某個內存池中, 那就僅僅會是因爲建立對象太多了。所有分析器都可以跟蹤對象分配(via allocation profiling), 依據內存分配的軌跡, 讓你知道 實際駐留在內存中的是哪些對象。

分配分析能定位到在哪一個地方建立了大量的對象. 使用分析器輔助進行GC調優的優勢是, 能肯定哪一種類型的對象最佔用內存, 以及哪些線程建立了最多的對象。

如下咱們經過實例介紹3種分配分析器: hprof, JVisualVM 和 AProf。實際上還有很是多分析器可供選擇, 有商業產品,也有免費工具, 但其功能和應用基本上都是類似的。

hprof

hprof 分析器內置於JDK之中。在各類環境下都可以使用, 通常優先使用這款工具。

要讓 hprof 和程序一塊兒執行, 需要改動啓動腳本, 類似這樣:

java -agentlib:hprof=heap=sites com.yourcompany.YourApplication

在程序退出時,會將分配信息dump(轉儲)到工做文件夾下的 java.hprof.txt 文件裏。使用文本編輯器打開, 並搜索「SITES BEGIN」 keyword, 可以看到:

SITES BEGIN (ordered by live bytes) Tue Dec  8 11:16:15 2015
          percent          live          alloc'ed  stack class
 rank   self  accum     bytes objs     bytes  objs trace name
    1  64.43% 4.43%   8370336 20121  27513408 66138 302116 int[]
    2  3.26% 88.49%    482976 20124   1587696 66154 302104 java.util.ArrayList
    3  1.76% 88.74%    241704 20121   1587312 66138 302115 eu.plumbr.demo.largeheap.ClonableClass0006
    ... 部分省略 ...

SITES END

從以上片斷可以看到, allocations 是依據每次建立的對象數量來排序的。第一行顯示所有對象中有 64.43% 的對象是整型數組(int[]), 在標識爲 302116 的位置建立。

搜索「TRACE 302116」可以看到:

TRACE 302116:   
    eu.plumbr.demo.largeheap.ClonableClass0006.<init>(GeneratorClass.java:11)
    sun.reflect.GeneratedConstructorAccessor7.newInstance(<Unknown Source>:Unknown line)
    sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
    java.lang.reflect.Constructor.newInstance(Constructor.java:422)

現在, 知道有 64.43% 的對象是整數數組, 在 ClonableClass0006 類的構造函數中, 第11行的位置, 接下來就可以優化代碼, 以下降GC的壓力。

Java VisualVM

本章前面的第一部分, 在監控 JVM 的GC行爲工具時介紹了 JVisualVM , 本節介紹其在分配分析上的應用。

JVisualVM 經過GUI的方式鏈接到正在執行的JVM。鏈接上目標JVM以後 :

打開「工具」 –> 「選項」菜單, 點擊 性能分析(Profiler) 標籤, 新增配置, 選擇 Profiler 內存, 確保勾選了「Record allocations stack traces」(記錄分配棧跟蹤)。
勾選「Settings」(設置) 複選框, 在內存設置標籤下,改動預設配置。
點擊「Memory」(內存) button開始進行內存分析。
讓程序執行一段時間,以收集關於對象分配的足夠信息。
單擊下方的「Snapshot」(快照) button。
可以獲取收集到的快照信息。

完畢上面的步驟後, 可以獲得類似這種信息:

上圖依照每個類被建立的對象數量多少來排序。看第一行可以知道, 建立的最多的對象是 int[] 數組. 鼠標右鍵單擊這行, 就可以看到這些對象都在哪些地方建立的:

與 hprof 相比, JVisualVM 更加easy使用 —— 比方上面的截圖中, 在一個地方就可以看到所有int[] 的分配信息, 因此屢次在同一處代碼進行分配的狀況就很是easy發現。

AProf

最重要的一款分析器,是由 Devexperts 開發的 AProf。內存分配分析器 AProf 也被打包爲 Java agent 的形式。

用 AProf 分析應用程序, 需要改動 JVM 啓動腳本,類似這樣:

java -javaagent:/path-to/aprof.jar com.yourcompany.YourApplication

從新啓動應用以後, 工做文件夾下會生成一個 aprof.txt 文件。此文件每分鐘更新一次, 包含這種信息:

========================================================================================================================
TOTAL allocation dump for 91,289 ms (0h01m31s)
Allocated 1,769,670,584 bytes in 24,868,088 objects of 425 classes in 2,127 locations
========================================================================================================================

Top allocation-inducing locations with the data types allocated from them
------------------------------------------------------------------------------------------------------------------------
eu.plumbr.demo.largeheap.ManyTargetsGarbageProducer.newRandomClassObject: 1,423,675,776 (80.44%) bytes in 17,113,721 (68.81%) objects (avg size 83 bytes)
    int[]: 711,322,976 (40.19%) bytes in 1,709,911 (6.87%) objects (avg size 416 bytes)
    char[]: 369,550,816 (20.88%) bytes in 5,132,759 (20.63%) objects (avg size 72 bytes)
    java.lang.reflect.Constructor: 136,800,000 (7.73%) bytes in 1,710,000 (6.87%) objects (avg size 80 bytes)
    java.lang.Object[]: 41,079,872 (2.32%) bytes in 1,710,712 (6.87%) objects (avg size 24 bytes)
    java.lang.String: 41,063,496 (2.32%) bytes in 1,710,979 (6.88%) objects (avg size 24 bytes)
    java.util.ArrayList: 41,050,680 (2.31%) bytes in 1,710,445 (6.87%) objects (avg size 24 bytes)
          ... cut for brevity ...

上面的輸出是依照 size 進行排序的。可以看出, 80.44% 的 bytes 和 68.81% 的 objects 是在 ManyTargetsGarbageProducer.newRandomClassObject() 方法中分配的。

當中, int[] 數組佔用了 40.19% 的內存, 是最大的一個。

繼續往下看, 會發現 allocation traces(分配痕跡)相關的內容, 也是以 allocation size 排序的:

Top allocated data types with reverse location traces
------------------------------------------------------------------------------------------------------------------------
int[]: 725,306,304 (40.98%) bytes in 1,954,234 (7.85%) objects (avg size 371 bytes)
    eu.plumbr.demo.largeheap.ClonableClass0006.: 38,357,696 (2.16%) bytes in 92,206 (0.37%) objects (avg size 416 bytes)
        java.lang.reflect.Constructor.newInstance: 38,357,696 (2.16%) bytes in 92,206 (0.37%) objects (avg size 416 bytes)
            eu.plumbr.demo.largeheap.ManyTargetsGarbageProducer.newRandomClassObject: 38,357,280 (2.16%) bytes in 92,205 (0.37%) objects (avg size 416 bytes)
            java.lang.reflect.Constructor.newInstance: 416 (0.00%) bytes in 1 (0.00%) objects (avg size 416 bytes)
... cut for brevity ...

可以看到, int[] 數組的分配, 在 ClonableClass0006 構造函數中繼續增大。

和其它工具同樣, AProf 揭露了分配的大小以及位置信息(allocation size and locations), 從而可以高速找到最耗內存的部分。在咱們看來, AProf 是最實用的分配分析器, 因爲它僅僅專一於內存分配, 因此作得最好。固然, 這款工具是開源免費的, 資源開銷也最小。

請繼續閱讀下一章: 7. GC 調優(實戰篇) - GC參考手冊

原文連接: GC Tuning: Tooling

翻譯人員: 鐵錨 http://blog.csdn.net/renfufei

翻譯時間: 2016年02月06日