JVM原理講解和調優

JVM原理講解和調優

1、什麼是JVM

JVM是Java Virtual Machine(Java虛擬機)的縮寫,JVM是一種用於計算設備的規範,它是一個虛構出來的計算機,是經過在實際的計算機上仿真模擬各類計算機功能來實現的。
Java語言的一個很是重要的特色就是與平臺的無關性。而使用Java虛擬機是實現這一特色的關鍵。通常的高級語言若是要在不一樣的平臺上運行,至少須要編譯成不一樣的目標代碼。而引入Java語言虛擬機後,Java語言在不一樣平臺上運行時不須要從新編譯。Java語言使用Java虛擬機屏蔽了與具體平臺相關的信息,使得Java語言編譯程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就能夠在多種平臺上不加修改地運行。Java虛擬機在執行字節碼時,把字節碼解釋成具體平臺上的機器指令執行。這就是Java的可以「一次編譯,處處運行」的緣由。html

從Java平臺的邏輯結構上來看,咱們能夠從下圖來了解JVM:

從上圖能清晰看到Java平臺包含的各個邏輯模塊,也能瞭解到JDK與JRE的區別,對於JVM自身的物理結構,咱們能夠從下圖鳥瞰一下:
java

2、JAVA代碼編譯和執行過程

Java代碼編譯是由Java源碼編譯器來完成,流程圖以下所示:

Java字節碼的執行是由JVM執行引擎來完成,流程圖以下所示:

Java代碼編譯和執行的整個過程包含了如下三個重要的機制:web

  • Java源碼編譯機制
  • 類加載機制
  • 類執行機制

Java源碼編譯機制

Java 源碼編譯由如下三個過程組成:算法

  • 分析和輸入到符號表
  • 註解處理
  • 語義分析和生成class文件

流程圖以下所示:
數組

最後生成的class文件由如下部分組成:tomcat

  • 結構信息。包括class文件格式版本號及各部分的數量與大小的信息
  • 元數據。對應於Java源碼中聲明與常量的信息。包含類/繼承的超類/實現的接口的聲明信息、域與方法聲明信息和常量池
  • 方法信息。對應Java源碼中語句和表達式對應的信息。包含字節碼、異常處理器表、求值棧與局部變量區大小、求值棧的類型記錄、調試符號信息

類加載機制

JVM的類加載是經過ClassLoader及其子類來完成的,類的層次關係和加載順序能夠由下圖來描述:
多線程

1)Bootstrap ClassLoader
負責加載$JAVA_HOME中jre/lib/rt.jar裏全部的class,由C++實現,不是ClassLoader子類併發

2)Extension ClassLoader
負責加載java平臺中擴展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包xss

3)App ClassLoader
負責記載classpath中指定的jar包及目錄中classsvg

4)Custom ClassLoader
屬於應用程序根據自身須要自定義的ClassLoader,如tomcat、jboss都會根據j2ee規範自行實現ClassLoader加載過程當中會先檢查類是否被已加載,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,只要某個classloader已加載就視爲已加載此類,保證此類只全部ClassLoader加載一次。而加載的順序是自頂向下,也就是由上層來逐層嘗試加載此類。

類執行機制

JVM是基於棧的體系結構來執行class字節碼的。線程建立後,都會產生程序計數器(PC)和棧(Stack),程序計數器存放下一條要執行的指令在方法內的偏移量,棧中存放一個個棧幀,每一個棧幀對應着每一個方法的每次調用,而棧幀又是有局部變量區和操做數棧兩部分組成,局部變量區用於存放方法中的局部變量和參數,操做數棧中用於存放方法執行過程當中產生的中間結果。棧的結構以下圖所示:

3、JVM內存管理和垃圾回收

JVM內存組成結構

JVM棧由堆、棧、本地方法棧、方法區等部分組成,結構圖以下所示:

1)堆

全部經過new建立的對象的內存都在堆中分配,堆的大小能夠經過-Xmx和-Xms來控制。堆被劃分爲新生代和舊生代,新生代又被進一步劃分爲Eden和Survivor區,最後Survivor由From Space和To Space組成,結構圖以下所示:

  • 新生代。新建的對象都是用新生代分配內存,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小能夠由-Xmn來控制,也能夠用-XX:SurvivorRatio來控制Eden和Survivor的比例
  • 舊生代。用於存放新生代中通過屢次垃圾回收仍然存活的對象
  • 持久帶(Permanent Space)實現方法區,主要存放全部已加載的類信息,方法信息,常量池等等。可經過-XX:PermSize和-XX:MaxPermSize來指定持久帶初始化值和最大值。Permanent Space並不等同於方法區,只不過是Hotspot JVM用Permanent Space來實現方法區而已,有些虛擬機沒有Permanent Space而用其餘機制來實現方法區。

2)棧

每一個線程執行每一個方法的時候都會在棧中申請一個棧幀,每一個棧幀包括局部變量區和操做數棧,用於存放這次方法調用過程當中的臨時變量、參數和中間結果。

-xss:設置每一個線程的堆棧大小. JDK1.5+ 每一個線程堆棧大小爲 1M,通常來講若是棧不是很深的話, 1M 是絕對夠用了的。

3)本地方法棧

用於支持native方法的執行,存儲了每一個native方法調用的狀態

4)方法區

存放了要加載的類信息、靜態變量、final類型的常量、屬性和方法信息。JVM用持久代(Permanet Generation)來存放方法區,可經過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值

垃圾回收

引用計數(Reference Counting):

比較古老的回收算法。原理是此對象有一個引用,即增長一個計數,刪除一個引用則減小一個計數。垃圾回收時,只用收集計數爲0的對象。此算法最致命的是沒法處理循環引用的問題。

標記-清除(Mark-Sweep):


此算法執行分兩階段。第一階段從引用根節點開始標記全部被引用的對象,第二階段遍歷整個堆,把未標記的對象清除。此算法須要暫停整個應用,同時,會產生內存碎片。

複製(Copying):


此算法把內存空間劃爲兩個相等的區域,每次只使用其中一個區域。垃圾回收時,遍歷當前使用區域,把正在使用中的對象複製到另一個區域中。算法每次只處理正在使用中的對象,所以複製成本比較小,同時複製過去之後還能進行相應的內存整理,不會出現「碎片」問題。固然,此算法的缺點也是很明顯的,就是須要兩倍內存空間。

標記-整理(Mark-Compact):


此算法結合了「標記-清除」和「複製」兩個算法的優勢。也是分兩階段,第一階段從根節點開始標記全部被引用對象,第二階段遍歷整個堆,把清除未標記對象而且把存活對象「壓縮」到堆的其中一塊,按順序排放。此算法避免了「標記-清除」的碎片問題,同時也避免了「複製」算法的空間問題。

JVM分別對新生代和舊生代採用不一樣的垃圾回收機制

新生代的GC:

新生代一般存活時間較短,所以基於Copying算法來進行回收,所謂Copying算法就是掃描出存活的對象,並複製到一塊新的徹底未使用的空間中,對應於新生代,就是在Eden和From Space或To Space之間copy。新生代採用空閒指針的方式來控制GC觸發,指針保持最後一個分配的對象在新生代區間的位置,當有新的對象要分配內存時,用於檢查空間是否足夠,不夠就觸發GC。當連續分配對象時,對象會逐漸從eden到survivor,最後到舊生代。

在執行機制上JVM提供了串行GC(Serial GC)、並行回收GC(Parallel Scavenge)和並行GC(ParNew)

1)串行GC

在整個掃描和複製過程採用單線程的方式來進行,適用於單CPU、新生代空間較小及對暫停時間要求不是很是高的應用上,是client級別默認的GC方式,能夠經過-XX:+UseSerialGC來強制指定

2)並行回收GC

在整個掃描和複製過程採用多線程的方式來進行,適用於多CPU、對暫停時間要求較短的應用上,是server級別默認採用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數

3)並行GC

與舊生代的併發GC配合使用

舊生代的GC:
舊生代與新生代不一樣,對象存活的時間比較長,比較穩定,所以採用標記(Mark)算法來進行回收,所謂標記就是掃描出存活的對象,而後再進行回收未被標記的對象,回收後對用空出的空間要麼進行合併,要麼標記出來便於下次進行分配,總之就是要減小內存碎片帶來的效率損耗。在執行機制上JVM提供了串行GC(Serial MSC)、並行GC(parallel MSC)和併發GC(CMS),具體算法細節還有待進一步深刻研究。

以上各類GC機制是須要組合使用的,指定方式由下表所示:

指定方式 新生代GC方式 舊生代GC方式
-XX:+UseSerialGC 串行GC 串行GC
-XX:+UseParallelGC 並行回收GC 並行GC
-XX:+UseConeMarkSweepGC 並行GC 併發GC
-XX:+UseParNewGC 並行GC 串行GC
-XX:+UseParallelOldGC 並行回收GC 並行GC
-XX:+ UseConeMarkSweepGC-XX:+UseParNewGC 串行GC 併發GC
不支持的組合 一、-XX:+UseParNewGC -XX:+UseParallelOldGC
二、-XX:+UseParNewGC -XX:+UseSerialGC

4、JVM內存調優

首先須要注意的是在對JVM內存調優的時候不能只看操做系統級別Java進程所佔用的內存,這個數值不能準確的反應堆內存的真實佔用狀況,由於GC事後這個值是不會變化的,所以內存調優的時候要更多地使用JDK提供的內存查看工具,好比JConsole和Java VisualVM。

對JVM內存的系統級的調優主要的目的是減小GC的頻率和Full GC的次數,過多的GC和Full GC是會佔用不少的系統資源(主要是CPU),影響系統的吞吐量。特別要關注Full GC,由於它會對整個堆進行整理,

致使Full GC通常因爲如下幾種狀況:

舊生代空間不足

調優時儘可能讓對象在新生代GC時被回收、讓對象在新生代多存活一段時間和不要建立過大的對象及數組避免直接在舊生代建立對象

Pemanet Generation空間不足

增大Perm Gen空間,避免太多靜態對象

統計獲得的GC後晉升到舊生代的平均大小大於舊生代剩餘空間,控制好新生代和舊生代的比例

System.gc()被顯示調用

垃圾回收不要手動觸發,儘可能依靠JVM自身的機制

調優手段主要是經過控制堆內存的各個部分的比例和GC策略來實現,下面來看看各部分比例不良設置會致使什麼後果

1)新生代設置太小

一是新生代GC次數很是頻繁,增大系統消耗;二是致使大對象直接進入舊生代,佔據了舊生代剩餘空間,誘發Full GC

2)新生代設置過大

一是新生代設置過大會致使舊生代太小(堆總量必定),從而誘發Full GC;二是新生代GC耗時大幅度增長

通常說來新生代佔整個堆1/3比較合適

3)Survivor設置太小

致使對象從eden直接到達舊生代,下降了在新生代的存活時間

4)Survivor設置過大

致使eden太小,增長了GC頻率

另外,經過-XX:MaxTenuringThreshold=n來控制新生代存活時間,儘可能讓對象在新生代被回收

由內存管理和垃圾回收可知新生代和舊生代都有多種GC策略和組合搭配,選擇這些策略對於咱們這些開發人員是個難題,JVM提供兩種較爲簡單的GC策略的設置方式

GC策略的設置方式

1)吞吐量優先

JVM以吞吐量爲指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,來達到吞吐量指標。這個值可由-XX:GCTimeRatio=n來設置

2)暫停時間優先

JVM以暫停時間爲指標,自行選擇相應的GC策略及控制新生代與舊生代的大小比例,儘可能保證每次GC形成的應用中止時間都在指定的數值範圍內完成。這個值可由-XX:MaxGCPauseRatio=n來設置

JVM常見配置

堆設置

-Xms:初始堆大小

-Xmx:最大堆大小

-XX:NewSize=n:設置年輕代大小

-XX:NewRatio=n:設置年輕代和年老代的比值。如:爲3,表示年輕代與年老代比值爲1:3,年輕代佔整個年輕代年老代和的1/4

-XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區佔整個年輕代的1/5

-XX:MaxPermSize=n:設置持久代大小

收集器設置

-XX:+UseSerialGC:設置串行收集器

-XX:+UseParallelGC:設置並行收集器

-XX:+UseParalledlOldGC:設置並行年老代收集器

-XX:+UseConcMarkSweepGC:設置併發收集器

垃圾回收統計信息

-XX:+PrintGC

-XX:+PrintGCDetails

-XX:+PrintGCTimeStamps

-Xloggc:filename

並行收集器設置

-XX:ParallelGCThreads=n:設置並行收集器收集時使用的CPU數。並行收集線程數。

-XX:MaxGCPauseMillis=n:設置並行收集最大暫停時間

-XX:GCTimeRatio=n:設置垃圾回收時間佔程序運行時間的百分比。公式爲1/(1+n)

併發收集器設置

-XX:+CMSIncrementalMode:設置爲增量模式。適用於單CPU狀況。

-XX:ParallelGCThreads=n:設置併發收集器年輕代收集方式爲並行收集時,使用的CPU數。並行收集線程數。

轉載自:http://www.javashuo.com/article/p-zmmouydy-kq.html

相關文章
相關標籤/搜索