JVM學習筆記

時間 2019-11-20

標籤 jvm 學習筆記欄目 Java 简体版

原文原文鏈接

從Java平臺的邏輯結構上來看，咱們能夠從下圖來了解JVM：< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" />java

< xmlnamespace prefix ="v" ns ="urn:schemas-microsoft-com:vml" />算法

從上圖能清晰看到Java平臺包含的各個邏輯模塊，也能瞭解到JDK與JRE的區別數組

對於JVM自身的物理結構，咱們能夠從下圖鳥瞰一下：tomcat

對於JVM的學習，在我看來這麼幾個部分最重要：多線程

Java代碼編譯和執行的整個過程
JVM內存管理及垃圾回收機制

下面將這兩個部分進行詳細學習併發

Java代碼編譯是由Java源碼編譯器來完成，流程圖以下所示：工具

Java學習

字節碼的執行是由JVM執行引擎來完成，流程圖以下所示：spa

Java代碼編譯和執行的整個過程包含了如下三個重要的機制：操作系統

Java源碼編譯機制
類加載機制
類執行機制

Java源碼編譯機制

Java 源碼編譯由如下三個過程組成：

分析和輸入到符號表
註解處理
語義分析和生成class文件

流程圖以下所示：

最後生成的class文件由如下部分組成：

結構信息。包括class文件格式版本號及各部分的數量與大小的信息
元數據。對應於Java源碼中聲明與常量的信息。包含類/繼承的超類/實現的接口的聲明信息、域與方法聲明信息和常量池
方法信息。對應Java源碼中語句和表達式對應的信息。包含字節碼、異常處理器表、求值棧與局部變量區大小、求值棧的類型記錄、調試符號信息

類加載機制

JVM的類加載是經過ClassLoader及其子類來完成的，類的層次關係和加載順序能夠由下圖來描述：

1）Bootstrap ClassLoader

負責加載$JAVA_HOME中jre/lib/rt.jar裏全部的class，由C++實現，不是ClassLoader子類

2）Extension ClassLoader

負責加載java平臺中擴展功能的一些jar包，包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包

3）App ClassLoader

負責記載classpath中指定的jar包及目錄中class

4）Custom ClassLoader

屬於應用程序根據自身須要自定義的ClassLoader，如tomcat、jboss都會根據j2ee規範自行實現ClassLoader

加載過程當中會先檢查類是否被已加載，檢查順序是自底向上，從Custom ClassLoader到BootStrap ClassLoader逐層檢查，只要某個classloader已加載就視爲已加載此類，保證此類只全部ClassLoader加載一次。而加載的順序是自頂向下，也就是由上層來逐層嘗試加載此類。

類執行機制

JVM是基於棧的體系結構來執行class字節碼的。線程建立後，都會產生程序計數器（PC）和棧（Stack），程序計數器存放下一條要執行的指令在方法內的偏移量，棧中存放一個個棧幀，每一個棧幀對應着每一個方法的每次調用，而棧幀又是有局部變量區和操做數棧兩部分組成，局部變量區用於存放方法中的局部變量和參數，操做數棧中用於存放方法執行過程當中產生的中間結果。棧的結構以下圖所示：

JVM內存組成結構

JVM棧由堆、棧、本地方法棧、方法區等部分組成，結構圖以下所示：

1）堆

全部經過new建立的對象的內存都在堆中分配，其大小能夠經過-Xmx和-Xms來控制。堆被劃分爲新生代和舊生代，新生代又被進一步劃分爲Eden和Survivor區，最後Survivor由From Space和To Space組成，結構圖以下所示：

新生代。新建的對象都是用新生代分配內存，Eden空間不足的時候，會把存活的對象轉移到Survivor中，新生代大小能夠由-Xmn來控制，也能夠用-XX:SurvivorRatio來控制Eden和Survivor的比例

舊生代。用於存放新生代中通過屢次垃圾回收仍然存活的對象

2）棧

每一個線程執行每一個方法的時候都會在棧中申請一個棧幀，每一個棧幀包括局部變量區和操做數棧，用於存放這次方法調用過程當中的臨時變量、參數和中間結果

3）本地方法棧

用於支持native方法的執行，存儲了每一個native方法調用的狀態

4）方法區

存放了要加載的類信息、靜態變量、final類型的常量、屬性和方法信息。JVM用持久代（Permanet Generation）來存放方法區，可經過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值

垃圾回收機制

JVM分別對新生代和舊生代採用不一樣的垃圾回收機制

新生代的GC：

新生代一般存活時間較短，所以基於Copying算法來進行回收，所謂Copying算法就是掃描出存活的對象，並複製到一塊新的徹底未使用的空間中，對應於新生代，就是在Eden和From Space或To Space之間copy。新生代採用空閒指針的方式來控制GC觸發，指針保持最後一個分配的對象在新生代區間的位置，當有新的對象要分配內存時，用於檢查空間是否足夠，不夠就觸發GC。當連續分配對象時，對象會逐漸從eden到survivor，最後到舊生代，

用java visualVM來查看，能明顯觀察到新生代滿了後，會把對象轉移到舊生代，而後清空繼續裝載，當舊生代也滿了後，就會報outofmemory的異常，以下圖所示：

在執行機制上JVM提供了串行GC（Serial GC）、並行回收GC（Parallel Scavenge）和並行GC（ParNew）

1）串行GC

在整個掃描和複製過程採用單線程的方式來進行，適用於單CPU、新生代空間較小及對暫停時間要求不是很是高的應用上，是client級別默認的GC方式，能夠經過-XX:+UseSerialGC來強制指定

2）並行回收GC

在整個掃描和複製過程採用多線程的方式來進行，適用於多CPU、對暫停時間要求較短的應用上，是server級別默認採用的GC方式，可用-XX:+UseParallelGC來強制指定，用-XX:ParallelGCThreads=4來指定線程數

3）並行GC

與舊生代的併發GC配合使用

舊生代的GC：

舊生代與新生代不一樣，對象存活的時間比較長，比較穩定，所以採用標記（Mark）算法來進行回收，所謂標記就是掃描出存活的對象，而後再進行回收未被標記的對象，回收後對用空出的空間要麼進行合併，要麼標記出來便於下次進行分配，總之就是要減小內存碎片帶來的效率損耗。在執行機制上JVM提供了串行GC（Serial MSC）、並行GC（parallel MSC）和併發GC（CMS），具體算法細節還有待進一步深刻研究。

以上各類GC機制是須要組合使用的，指定方式由下表所示：

指定方式	新生代GC方式	舊生代GC方式
-XX:+UseSerialGC	串行GC	串行GC
-XX:+UseParallelGC	並行回收GC	並行GC
-XX:+UseConeMarkSweepGC	並行GC	併發GC
-XX:+UseParNewGC	並行GC	串行GC
-XX:+UseParallelOldGC	並行回收GC	並行GC
-XX:+ UseConeMarkSweepGC -XX:+UseParNewGC	串行GC	併發GC
不支持的組合	一、-XX:+UseParNewGC -XX:+UseParallelOldGC 二、-XX:+UseParNewGC -XX:+UseSerialGC

首先須要注意的是在對JVM內存調優的時候不能只看操做系統級別Java進程所佔用的內存，這個數值不能準確的反應堆內存的真實佔用狀況，由於GC事後這個值是不會變化的，所以內存調優的時候要更多地使用JDK提供的內存查看工具，好比JConsole和Java VisualVM。

對JVM內存的系統級的調優主要的目的是減小GC的頻率和Full GC的次數，過多的GC和Full GC是會佔用不少的系統資源（主要是CPU），影響系統的吞吐量。特別要關注Full GC，由於它會對整個堆進行整理，致使Full GC通常因爲如下幾種狀況：

舊生代空間不足調優時儘可能讓對象在新生代GC時被回收、讓對象在新生代多存活一段時間和不要建立過大的對象及數組避免直接在舊生代建立對象
Pemanet Generation空間不足增大Perm Gen空間，避免太多靜態對象
統計獲得的GC後晉升到舊生代的平均大小大於舊生代剩餘空間控制好新生代和舊生代的比例
System.gc()被顯示調用垃圾回收不要手動觸發，儘可能依靠JVM自身的機制

調優手段主要是經過控制堆內存的各個部分的比例和GC策略來實現，下面來看看各部分比例不良設置會致使什麼後果

1）新生代設置太小

一是新生代GC次數很是頻繁，增大系統消耗；二是致使大對象直接進入舊生代，佔據了舊生代剩餘空間，誘發Full GC

2）新生代設置過大

一是新生代設置過大會致使舊生代太小（堆總量必定），從而誘發Full GC；二是新生代GC耗時大幅度增長

通常說來新生代佔整個堆1/3比較合適

3）Survivor設置太小

致使對象從eden直接到達舊生代，下降了在新生代的存活時間

4）Survivor設置過大

致使eden太小，增長了GC頻率

另外，經過-XX:MaxTenuringThreshold=n來控制新生代存活時間，儘可能讓對象在新生代被回收

由上一篇博文JVM學習筆記（三）------內存管理和垃圾回收可知新生代和舊生代都有多種GC策略和組合搭配，選擇這些策略對於咱們這些開發人員是個難題，JVM提供兩種較爲簡單的GC策略的設置方式

1）吞吐量優先

JVM以吞吐量爲指標，自行選擇相應的GC策略及控制新生代與舊生代的大小比例，來達到吞吐量指標。這個值可由-XX:GCTimeRatio=n來設置

2）暫停時間優先

JVM以暫停時間爲指標，自行選擇相應的GC策略及控制新生代與舊生代的大小比例，儘可能保證每次GC形成的應用中止時間都在指定的數值範圍內完成。這個值可由-XX:MaxGCPauseRatio=n來設置

最後彙總一下JVM常見配置

堆設置
1. -Xms:初始堆大小
2. -Xmx:最大堆大小
3. -XX:NewSize=n:設置年輕代大小
4. -XX:NewRatio=n:設置年輕代和年老代的比值。如:爲3，表示年輕代與年老代比值爲1：3，年輕代佔整個年輕代年老代和的1/4
5. -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如：3，表示Eden：Survivor=3：2，一個Survivor區佔整個年輕代的1/5
6. -XX:MaxPermSize=n:設置持久代大小
收集器設置
1. -XX:+UseSerialGC:設置串行收集器
2. -XX:+UseParallelGC:設置並行收集器
3. -XX:+UseParalledlOldGC:設置並行年老代收集器
4. -XX:+UseConcMarkSweepGC:設置併發收集器
垃圾回收統計信息
1. -XX:+PrintGC
2. -XX:+PrintGCDetails
3. -XX:+PrintGCTimeStamps
4. -Xloggc:filename
並行收集器設置
1. -XX:ParallelGCThreads=n:設置並行收集器收集時使用的CPU數。並行收集線程數。
2. -XX:MaxGCPauseMillis=n:設置並行收集最大暫停時間
3. -XX:GCTimeRatio=n:設置垃圾回收時間佔程序運行時間的百分比。公式爲1/(1+n)
併發收集器設置
1. -XX:+CMSIncrementalMode:設置爲增量模式。適用於單CPU狀況。
2. -XX:ParallelGCThreads=n:設置併發收集器年輕代收集方式爲並行收集時，使用的CPU數。並行收集線程數。