Spark（八）JVM調優以及GC垃圾收集器

時間 2019-11-12

標籤 spark jvm 以及垃圾收集欄目 Spark 简体版

原文原文鏈接

一JVM結構

1 Java內存結構

JVM內存結構主要有三大塊：堆內存、方法區和棧。java

堆內存是JVM中最大的一塊由年輕代和老年代組成，而年輕代內存又被分紅三部分，Eden空間、From Survivor空間、To Survivor空間,默認狀況下年輕代按照8:1:1的比例來分配；程序員

方法區存儲類信息、常量、靜態變量等數據，是線程共享的區域，爲與Java堆區分，方法區還有一個別名Non-Heap(非堆)；算法

棧又分爲java虛擬機棧和本地方法棧主要用於方法的執行。數據結構

2 各區域內存大小

3 控制參數

-Xms設置堆的最小空間大小。多線程

-Xmx設置堆的最大空間大小。併發

-XX:NewSize設置新生代最小空間大小。jvm

-XX:MaxNewSize設置新生代最大空間大小。工具

-XX:PermSize設置永久代最小空間大小。佈局

-XX:MaxPermSize設置永久代最大空間大小。性能

-Xss設置每一個線程的堆棧大小。

沒有直接設置老年代的參數，可是能夠設置堆空間大小和新生代空間大小兩個參數來間接控制。

老年代空間大小=堆空間大小-年輕代大空間大小

4 JVM和系統調用間的關係

方法區和堆是全部線程共享的內存區域；而java棧、本地方法棧和程序員計數器是運行是線程私有的內存區域。

二JVM各區域的做用

1 Java堆

對於大多數應用來講，Java堆（Java Heap）是Java虛擬機所管理的內存中最大的一塊。Java堆是被全部線程共享的一塊內存區域，在虛擬機啓動時建立。此內存區域的惟一目的就是存放對象實例，幾乎全部的對象實例都在這裏分配內存。

Java堆是垃圾收集器管理的主要區域，所以不少時候也被稱作「GC堆」。若是從內存回收的角度看，因爲如今收集器基本都是採用的分代收集算法，因此Java堆中還能夠細分爲：新生代和老年代；再細緻一點的有Eden空間、From Survivor空間、To Survivor空間等。

根據Java虛擬機規範的規定，Java堆能夠處於物理上不連續的內存空間中，只要邏輯上是連續的便可，就像咱們的磁盤空間同樣。在實現時，既能夠實現成固定大小的，也能夠是可擴展的，不過當前主流的虛擬機都是按照可擴展來實現的（經過-Xmx和-Xms控制）。

若是在堆中沒有內存完成實例分配，而且堆也沒法再擴展時，將會拋出OutOfMemoryError異常。

2 方法區

方法區（Method Area）與Java堆同樣，是各個線程共享的內存區域，它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分，可是它卻有一個別名叫作Non-Heap（非堆），目的應該是與Java堆區分開來。

對於習慣在HotSpot虛擬機上開發和部署程序的開發者來講，不少人願意把方法區稱爲「永久代」（Permanent Generation），本質上二者並不等價，僅僅是由於HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區，或者說使用永久代來實現方法區而已。

Java虛擬機規範對這個區域的限制很是寬鬆，除了和Java堆同樣不須要連續的內存和能夠選擇固定大小或者可擴展外，還能夠選擇不實現垃圾收集。相對而言，垃圾收集行爲在這個區域是比較少出現的，但並不是數據進入了方法區就如永久代的名字同樣「永久」存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載，通常來講這個區域的回收「成績」比較難以使人滿意，尤爲是類型的卸載，條件至關苛刻，可是這部分區域的回收確實是有必要的。

根據Java虛擬機規範的規定，當方法區沒法知足內存分配需求時，將拋出OutOfMemoryError異常。

3 程序計數器

程序計數器（Program Counter Register）是一塊較小的內存空間，它的做用能夠看作是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏（僅是概念模型，各類虛擬機可能會經過一些更高效的方式去實現），字節碼解釋器工做時就是經過改變這個計數器的值來選取下一條須要執行的字節碼指令，分支、循環、跳轉、異常處理、線程恢復等基礎功能都須要依賴這個計數器來完成。
因爲Java虛擬機的多線程是經過線程輪流切換並分配處理器執行時間的方式來實現的，在任何一個肯定的時刻，一個處理器（對於多核處理器來講是一個內核）只會執行一條線程中的指令。所以，爲了線程切換後能恢復到正確的執行位置，每條線程都須要有一個獨立的程序計數器，各條線程之間的計數器互不影響，獨立存儲，咱們稱這類內存區域爲「線程私有」的內存。
若是線程正在執行的是一個Java方法，這個計數器記錄的是正在執行的虛擬機字節碼指令的地址；若是正在執行的是Natvie方法，這個計數器值則爲空（Undefined）。

此內存區域是惟一一個在Java虛擬機規範中沒有規定任何OutOfMemoryError狀況的區域。

4 VM棧

與程序計數器同樣，Java虛擬機棧（Java Virtual Machine Stacks）也是線程私有的，它的生命週期與線程相同。虛擬機棧描述的是Java方法執行的內存模型：每一個方法被執行的時候都會同時建立一個棧幀（Stack Frame）用於存儲局部變量表、操做棧、動態連接、方法出口等信息。每個方法被調用直至執行完成的過程，就對應着一個棧幀在虛擬機棧中從入棧到出棧的過程。

局部變量表存放了編譯期可知的各類基本數據類型（boolean、byte、char、short、int、float、long、double）、對象引用（reference類型，它不等同於對象自己，根據不一樣的虛擬機實現，它多是一個指向對象起始地址的引用指針，也可能指向一個表明對象的句柄或者其餘與此對象相關的位置）和returnAddress類型（指向了一條字節碼指令的地址）。

其中64位長度的long和double類型的數據會佔用2個局部變量空間（Slot），其他的數據類型只佔用1個。局部變量表所需的內存空間在編譯期間完成分配，當進入一個方法時，這個方法須要在幀中分配多大的局部變量空間是徹底肯定的，在方法運行期間不會改變局部變量表的大小。

在Java虛擬機規範中，對這個區域規定了兩種異常情況：若是線程請求的棧深度大於虛擬機所容許的深度，將拋出StackOverflowError異常；若是虛擬機棧能夠動態擴展（當前大部分的Java虛擬機均可動態擴展，只不過Java虛擬機規範中也容許固定長度的虛擬機棧），當擴展時沒法申請到足夠的內存時會拋出OutOfMemoryError異常。

5 本地方法棧

本地方法棧（Native Method Stacks）與虛擬機棧所發揮的做用是很是類似的，其區別不過是虛擬機棧爲虛擬機執行Java方法（也就是字節碼）服務，而本地方法棧則是爲虛擬機使用到的Native方法服務。虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並無強制規定，所以具體的虛擬機能夠自由實現它。甚至有的虛擬機（譬如Sun HotSpot虛擬機）直接就把本地方法棧和虛擬機棧合二爲一。與虛擬機棧同樣，本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。

3、GC概述

垃圾收集 Garbage Collection 一般被稱爲「GC」，它誕生於1960年 MIT 的 Lisp 語言，通過半個多世紀，目前已經十分紅熟了。

jvm 中，程序計數器、虛擬機棧、本地方法棧都是隨線程而生隨線程而滅，棧幀隨着方法的進入和退出作入棧和出棧操做，實現了自動的內存清理，所以，咱們的內存垃圾回收主要集中於 java 堆和方法區中，在程序運行期間，這部份內存的分配和使用都是動態的。

3.1GC是什麼

GC實際上是一種自動的內存管理工具，其行爲主要包括2步

在Java堆中，爲新建立的對象分配空間
在Java堆中，回收沒用的對象佔用的空間

3.2爲何須要GC

釋放開發人員的生產力

3.3爲何須要多種GC

首先，Java平臺被部署在各類各樣的硬件資源上，其次，在Java平臺上部署和運行着各類各樣的應用，而且用戶對不一樣的應用的 性能指標 (吞吐率和延遲) 預期也不一樣，爲了知足不一樣應用的對內存管理的不一樣需求，JVM提供了多種GC以供選擇

性能指標

最大停頓時長：垃圾回收致使的應用停頓時間的最大值
吞吐率：垃圾回收停頓時長和應用運行總時長的比例

不一樣的GC能知足不一樣應用不一樣的性能需求，現有的GC包括：

序列化GC(serial garbage collector)：適合佔用內存少的應用
並行GC 或吞吐率GC(parallel or throughput garbage collector)：適合佔用內存較多，多CPU，追求高吞吐率的應用
併發GC：適合佔用內存較多，多CPU的應用，對延遲有要求的應用

3.4對象存活的判斷

判斷對象是否存活通常有兩種方式：

引用計數：每一個對象有一個引用計數屬性，新增一個引用時計數加1，引用釋放時計數減1，計數爲0時能夠回收。此方法簡單，缺點是沒法解決對象相互循環引用的問題。

可達性分析（Reachability Analysis）：從GC Roots開始向下搜索，搜索所走過的路徑稱爲引用鏈。當一個對象到GC Roots沒有任何引用鏈相連時，則證實此對象是不可用的。不可達對象。

在Java語言中，GC Roots包括：

虛擬機棧中引用的對象。

方法區中類靜態屬性實體引用的對象。

方法區中常量引用的對象。

本地方法棧中JNI引用的對象。

因爲循環引用的問題，通常採用跟蹤（可達性分析）方法

4、垃圾回收算法

4.1 標記 -清除算法

「標記-清除」（Mark-Sweep）算法，如它的名字同樣，算法分爲「標記」和「清除」兩個階段：首先標記出全部須要回收的對象，在標記完成後統一回收掉全部被標記的對象。之因此說它是最基礎的收集算法，是由於後續的收集算法都是基於這種思路並對其缺點進行改進而獲得的。

它的主要缺點有兩個：一個是效率問題，標記和清除過程的效率都不高；另一個是空間問題，標記清除以後會產生大量不連續的內存碎片，空間碎片太多可能會致使，當程序在之後的運行過程當中須要分配較大對象時沒法找到足夠的連續內存而不得不提早觸發另外一次垃圾收集動做。

4.2 複製算法

「複製」（Copying）的收集算法，它將可用內存按容量劃分爲大小相等的兩塊，每次只使用其中的一塊。當這一塊的內存用完了，就將還存活着的對象複製到另一塊上面，而後再把已使用過的內存空間一次清理掉。

這樣使得每次都是對其中的一塊進行內存回收，內存分配時也就不用考慮內存碎片等複雜狀況，只要移動堆頂指針，按順序分配內存便可，實現簡單，運行高效。只是這種算法的代價是將內存縮小爲原來的一半，持續複製長生存期的對象則致使效率下降。

4.3 標記-整理算法

複製收集算法在對象存活率較高時就要執行較多的複製操做，效率將會變低。更關鍵的是，若是不想浪費50%的空間，就須要有額外的空間進行分配擔保，以應對被使用的內存中全部對象都100%存活的極端狀況，因此在老年代通常不能直接選用這種算法。

根據老年代的特色，有人提出了另一種「標記-整理」（Mark-Compact）算法，標記過程仍然與「標記-清除」算法同樣，但後續步驟不是直接對可回收對象進行清理，而是讓全部存活的對象都向一端移動，而後直接清理掉端邊界之外的內存

4.4 分代收集算法

分代收集法是目前大部分JVM所採用的方法，其核心思想是根據對象存活的不一樣生命週期將內存劃分爲不一樣的域，通常狀況下將GC堆劃分爲老生代(Tenured/Old Generation)和新生代(Young Generation)。老生代的特色是每次垃圾回收時只有少許對象須要被回收，新生代的特色是每次垃圾回收時都有大量垃圾須要被回收，所以能夠根據不一樣區域選擇不一樣的算法。

目前大部分JVM的GC對於新生代都採起Copying算法，由於新生代中每次垃圾回收都要回收大部分對象，即要複製的操做比較少，但一般並非按照1：1來劃分新生代。通常將新生代劃分爲一塊較大的Eden空間和兩個較小的Survivor空間(From Space, To Space)，每次使用Eden空間和其中的一塊Survivor空間，當進行回收時，將該兩塊空間中還存活的對象複製到另外一塊Survivor空間中。

而老生代由於每次只回收少許對象，於是採用Mark-Compact算法。

對象的內存分配主要在新生代的Eden Space和Survivor Space的From Space(Survivor目前存放對象的那一塊)，少數狀況會直接分配到老生代。當新生代的Eden Space和From Space空間不足時就會發生一次GC，進行GC後，Eden Space和From Space區的存活對象會被挪到To Space，而後將Eden Space和From Space進行清理。若是To Space沒法足夠存儲某個對象，則將這個對象存儲到老生代。在進行GC後，使用的即是Eden Space和To Space了，如此反覆循環。當對象在Survivor區躲過一次GC後，其年齡就會+1。默認狀況下年齡到達15的對象會被移到老生代中。

5、垃圾收集器

若是說收集算法是內存回收的方法論，垃圾收集器就是內存回收的具體實現，不一樣廠商、不一樣版本的虛擬機實現差異很大，HotSpot中包含的收集器以下：

5.1 Serial收集器

串行收集器是最古老，最穩定以及效率高的收集器，可能會產生較長的停頓，只使用一個線程去回收。新生代、老年代使用串行回收；新生代複製算法、老年代標記-壓縮；垃圾收集的過程當中會Stop The World（服務暫停）

參數控制：-XX:+UseSerialGC 串行收集器

5.2 ParNew收集器

ParNew收集器其實就是Serial收集器的多線程版本。新生代並行，老年代串行；新生代複製算法、老年代標記-壓縮

參數控制：-XX:+UseParNewGC ParNew收集器

-XX:ParallelGCThreads 限制線程數量

5.3 Parallel收集器

Parallel Scavenge收集器相似ParNew收集器，Parallel收集器更關注系統的吞吐量。能夠經過參數來打開自適應調節策略，虛擬機會根據當前系統的運行狀況收集性能監控信息，動態調整這些參數以提供最合適的停頓時間或最大的吞吐量；也能夠經過參數控制GC的時間不大於多少毫秒或者比例；新生代複製算法、老年代標記-壓縮

參數控制：-XX:+UseParallelGC 使用Parallel收集器+ 老年代串行

5.4 CMS收集器

CMS（Concurrent Mark Sweep）收集器是一種以獲取最短回收停頓時間爲目標的收集器。目前很大一部分的Java應用都集中在互聯網站或B/S系統的服務端上，這類應用尤爲重視服務的響應速度，但願系統停頓時間最短，以給用戶帶來較好的體驗。

從名字（包含「Mark Sweep」）上就能夠看出CMS收集器是基於「標記-清除」算法實現的，它的運做過程相對於前面幾種收集器來講要更復雜一些，整個過程分爲4個步驟，包括：

初始標記（CMS initial mark）

併發標記（CMS concurrent mark）

從新標記（CMS remark）

併發清除（CMS concurrent sweep）

其中初始標記、從新標記這兩個步驟仍然須要「Stop The World」。初始標記僅僅只是標記一下GC Roots能直接關聯到的對象，速度很快，併發標記階段就是進行GC Roots Tracing的過程，而從新標記階段則是爲了修正併發標記期間，因用戶程序繼續運做而致使標記產生變更的那一部分對象的標記記錄，這個階段的停頓時間通常會比初始標記階段稍長一些，但遠比並發標記的時間短。
因爲整個過程當中耗時最長的併發標記和併發清除過程當中，收集器線程均可以與用戶線程一塊兒工做，因此整體上來講，CMS收集器的內存回收過程是與用戶線程一塊兒併發地執行。老年代收集器（新生代使用ParNew）

優勢:併發收集、低停頓

缺點：產生大量空間碎片、併發階段會下降吞吐量

參數控制：-XX:+UseConcMarkSweepGC 使用CMS收集器

-XX:+ UseCMSCompactAtFullCollection Full GC後，進行一次碎片整理；整理過程是獨佔的，會引發停頓時間變長

-XX:+CMSFullGCsBeforeCompaction 設置進行幾回Full GC後，進行一次碎片整理

-XX:ParallelCMSThreads 設定CMS的線程數量（通常狀況約等於可用CPU數量）

5.5 G1收集器

G1是目前技術發展的最前沿成果之一，HotSpot開發團隊賦予它的使命是將來能夠替換掉JDK1.5中發佈的CMS收集器。與CMS收集器相比G1收集器有如下特色：

1. 空間整合，G1收集器採用標記整理算法，不會產生內存空間碎片。分配大對象時不會由於沒法找到連續空間而提早觸發下一次GC。

2. 可預測停頓，這是G1的另外一大優點，下降停頓時間是G1和CMS的共同關注點，但G1除了追求低停頓外，還能創建可預測的停頓時間模型，能讓使用者明確指定在一個長度爲N毫秒的時間片斷內，消耗在垃圾收集上的時間不得超過N毫秒，這幾乎已是實時Java（RTSJ）的垃圾收集器的特徵了。

上面提到的垃圾收集器，收集的範圍都是整個新生代或者老年代，而G1再也不是這樣。使用G1收集器時，Java堆的內存佈局與其餘收集器有很大差異，它將整個Java堆劃分爲多個大小相等的獨立區域（Region），雖然還保留有新生代和老年代的概念，但新生代和老年代再也不是物理隔閡了，它們都是一部分（能夠不連續）Region的集合。

G1對Heap的劃分

G1的新生代收集跟ParNew相似，當新生代佔用達到必定比例的時候，開始出發收集。和CMS相似，G1收集器收集老年代對象會有短暫停頓。

收集步驟

一、標記階段，首先初始標記(Initial-Mark),這個階段是停頓的(Stop the World Event)，而且會觸發一次普通Mintor GC。對應GC log:GC pause (young) (inital-mark)

二、Root Region Scanning，程序運行過程當中會回收survivor區(存活到老年代)，這一過程必須在young GC以前完成。

三、Concurrent Marking，在整個堆中進行併發標記(和應用程序併發執行)，此過程可能被young GC中斷。在併發標記階段，若發現區域對象中的全部對象都是垃圾，那個這個區域會被當即回收(圖中打X)。同時，併發標記過程當中，會計算每一個區域的對象活性(區域中存活對象的比例)。

四、Remark, 再標記，會有短暫停頓(STW)。再標記階段是用來收集併發標記階段產生新的垃圾(併發階段和應用程序一同運行)；G1中採用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)。

五、Copy/Clean up，多線程清除失活對象，會有STW。G1將回收區域的存活對象拷貝到新區域，清除Remember Sets，併發清空回收區域並把它返回到空閒區域鏈表中。

六、複製/清除過程後。回收區域的活性對象已經被集中回收到深藍色和深綠色區域。

6、經常使用的收集器組合

	新生代GC策略	年老代GC策略	說明
組合1	Serial	Serial Old	Serial和Serial Old都是單線程進行GC，特色就是GC時暫停全部應用線程。
組合2	Serial	CMS+Serial Old	CMS（Concurrent Mark Sweep）是併發GC，實現GC線程和應用線程併發工做，不須要暫停全部應用線程。另外，當CMS進行GC失敗時，會自動使用Serial Old策略進行GC。
組合3	ParNew	CMS	使用-XX:+UseParNewGC選項來開啓。ParNew是Serial的並行版本，能夠指定GC線程數，默認GC線程數爲CPU的數量。可使用-XX:ParallelGCThreads選項指定GC的線程數。若是指定了選項-XX:+UseConcMarkSweepGC選項，則新生代默認使用ParNew GC策略。
組合4	ParNew	Serial Old	使用-XX:+UseParNewGC選項來開啓。新生代使用ParNew GC策略，年老代默認使用Serial Old GC策略。
組合5	Parallel Scavenge	Serial Old	Parallel Scavenge策略主要是關注一個可控的吞吐量：應用程序運行時間 / (應用程序運行時間 + GC時間)，可見這會使得CPU的利用率儘量的高，適用於後臺持久運行的應用程序，而不適用於交互較多的應用程序。
組合6	Parallel Scavenge	Parallel Old	Parallel Old是Serial Old的並行版本
組合7	G1GC	G1GC	-XX:+UnlockExperimentalVMOptions -XX:+UseG1GC #開啓-XX:MaxGCPauseMillis =50 #暫停時間目標-XX:GCPauseIntervalMillis =200 #暫停間隔目標-XX:+G1YoungGenSize=512m #年輕代大小-XX:SurvivorRatio=6 #倖存區比例