java垃圾回收機制

時間 2019-12-09

標籤 java 垃圾回收機制欄目 Java 简体版

原文原文鏈接

一、垃圾收集器概述

垃圾收集器是垃圾回收算法（標記-清除算法、複製算法、標記-整理算法、火車算法）的具體實現，不一樣商家、不一樣版本的JVM所提供的垃圾收集器可能會有很在差異，本文主要介紹HotSpot虛擬機中的垃圾收集器。

1-一、垃圾收集器組合

JDK7/8後，HotSpot虛擬機全部收集器及組合（連線），以下圖：

（A）、圖中展現了7種不一樣分代的收集器：

       Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old、CMS、G1；

（B）、而它們所處區域，則代表其是屬於新生代收集器仍是老年代收集器：

      新生代收集器：Serial、ParNew、Parallel Scavenge；

      老年代收集器：Serial Old、Parallel Old、CMS；

      整堆收集器：G1；

（C）、兩個收集器間有連線，代表它們能夠搭配使用：

       Serial/Serial Old、Serial/CMS、ParNew/Serial Old、ParNew/CMS、Parallel Scavenge/Serial Old、Parallel Scavenge/Parallel Old、G1；

（D）、其中Serial Old做爲CMS出現"Concurrent Mode Failure"失敗的後備預案（後面介紹）；

1-二、併發垃圾收集和並行垃圾收集的區別

（A）、並行（Parallel）

       指多條垃圾收集線程並行工做，但此時用戶線程仍然處於等待狀態；

       如ParNew、Parallel Scavenge、Parallel Old；

（B）、併發（Concurrent）

       指用戶線程與垃圾收集線程同時執行（但不必定是並行的，可能會交替執行）；

      用戶程序在繼續運行，而垃圾收集程序線程運行於另外一個CPU上；

       如CMS、G1（也有並行）；

1-三、Minor GC和Full GC的區別

（A）、Minor GC

       又稱新生代GC，指發生在新生代的垃圾收集動做；

       由於Java對象大可能是朝生夕滅，因此Minor GC很是頻繁，通常回收速度也比較快；

（B）、Full GC

       又稱Major GC或老年代GC，指發生在老年代的GC；

       出現Full GC常常會伴隨至少一次的Minor GC（不是絕對，Parallel Sacvenge收集器就能夠選擇設置Major GC策略）；

      Major GC速度通常比Minor GC慢10倍以上；

下面將介紹這些收集器的特性、基本原理和使用場景，並重點分析CMS和G1這兩款相對複雜的收集器；但須要明確一個觀點：

沒有最好的收集器，更沒有萬能的收集；

選擇的只能是適合具體應用場景的收集器。

二、Serial收集器

       Serial（串行）垃圾收集器是最基本、發展歷史最悠久的收集器；

       JDK1.3.1前是HotSpot新生代收集的惟一選擇；

一、特色

      針對新生代；

      採用複製算法；

      單線程收集；

       進行垃圾收集時，必須暫停全部工做線程，直到完成；

       即會"Stop The World"；

      Serial/Serial Old組合收集器運行示意圖以下：

二、應用場景

      依然是HotSpot在Client模式下默認的新生代收集器；

      也有優於其餘收集器的地方：

      簡單高效（與其餘收集器的單線程相比）；

      對於限定單個CPU的環境來講，Serial收集器沒有線程交互（切換）開銷，能夠得到最高的單線程收集效率；

      在用戶的桌面應用場景中，可用內存通常不大（幾十M至一兩百M），能夠在較短期內完成垃圾收集（幾十MS至一百多MS）,只要不頻繁發生，這是能夠接受的

三、設置參數

      "-XX:+UseSerialGC"：添加該參數來顯式的使用串行垃圾收集器；

四、Stop TheWorld說明

      JVM在後臺自動發起和自動完成的，在用戶不可見的狀況下，把用戶正常的工做線程所有停掉，即GC停頓；

      會帶給用戶不良的體驗；

      從JDK1.3到如今，從Serial收集器-》Parallel收集器-》CMS-》G1，用戶線程停頓時間不斷縮短，但仍然沒法徹底消除；

      更多"Stop The World"信息請參考：《Java虛擬機垃圾回收(一) 基礎》"2-二、可達性分析算法"

更多Serial收集器請參考：

      《Memory Management in the Java HotSpot™ Virtual Machine》 4.3節 Serial Collector（內存管理白皮書）： http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

      《Java Platform, Standard Edition HotSpot Virtual Machine Garbage Collection Tuning Guide》第5節 Available Collectors（官方的垃圾收集調優指南）： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/collectors.html#sthref27

三、ParNew收集器

      ParNew垃圾收集器是Serial收集器的多線程版本。

一、特色

      除了多線程外，其他的行爲、特色和Serial收集器同樣；

      如Serial收集器可用控制參數、收集算法、Stop The World、內存分配規則、回收策略等；

      兩個收集器共用了很多代碼；

      ParNew/Serial Old組合收集器運行示意圖以下：

二、應用場景

      在Server模式下，ParNew收集器是一個很是重要的收集器，由於除Serial外，目前只有它能與CMS收集器配合工做；

      但在單個CPU環境中，不會比Serail收集器有更好的效果，由於存在線程交互開銷。

三、設置參數

      "-XX:+UseConcMarkSweepGC"：指定使用CMS後，會默認使用ParNew做爲新生代收集器；

      "-XX:+UseParNewGC"：強制指定使用ParNew；

      "-XX:ParallelGCThreads"：指定垃圾收集的線程數量，ParNew默認開啓的收集線程與CPU的數量相同；

四、爲何只有ParNew能與CMS收集器配合

      CMS是HotSpot在JDK1.5推出的第一款真正意義上的併發（Concurrent）收集器，第一次實現了讓垃圾收集線程與用戶線程（基本上）同時工做；

      CMS做爲老年代收集器，但卻沒法與JDK1.4已經存在的新生代收集器Parallel Scavenge配合工做；

      由於Parallel Scavenge（以及G1）都沒有使用傳統的GC收集器代碼框架，而另外獨立實現；而其他幾種收集器則共用了部分的框架代碼；

      關於CMS收集器後面會詳細介紹。

四、Parallel Scavenge收集器

      Parallel Scavenge垃圾收集器由於與吞吐量關係密切，也稱爲吞吐量收集器（Throughput Collector）。

一、特色

（A）、有一些特色與ParNew收集器類似

      新生代收集器；

      採用複製算法；

      多線程收集；

（B）、主要特色是：它的關注點與其餘收集器不一樣

      CMS等收集器的關注點是儘量地縮短垃圾收集時用戶線程的停頓時間；

      而Parallel Scavenge收集器的目標則是達一個可控制的吞吐量（Throughput）；

      關於吞吐量與收集器關注點說明詳見本節後面；

二、應用場景

      高吞吐量爲目標，即減小垃圾收集時間，讓用戶代碼得到更長的運行時間；

      當應用程序運行在具備多個CPU上，對暫停時間沒有特別高的要求時，即程序主要在後臺進行計算，而不須要與用戶進行太多交互；

      例如，那些執行批量處理、訂單處理、工資支付、科學計算的應用程序；

三、設置參數

      Parallel Scavenge收集器提供兩個參數用於精確控制吞吐量：

（A）、"-XX:MaxGCPauseMillis"

      控制最大垃圾收集停頓時間，大於0的毫秒數；

      MaxGCPauseMillis設置得稍小，停頓時間可能會縮短，但也可能會使得吞吐量降低；

      由於可能致使垃圾收集發生得更頻繁；

（B）、"-XX:GCTimeRatio"

      設置垃圾收集時間佔總時間的比率，0<n<100的整數；

      GCTimeRatio至關於設置吞吐量大小；

      垃圾收集執行時間佔應用程序執行時間的比例的計算方法是：

      1 / (1 + n)

      例如，選項-XX:GCTimeRatio=19，設置了垃圾收集時間佔總時間的5%--1/(1+19)；

      默認值是1%--1/(1+99)，即n=99；

垃圾收集所花費的時間是年輕一代和老年代收集的總時間；

若是沒有知足吞吐量目標，則增長代的內存大小以儘可能增長用戶程序運行的時間；

此外，還有一個值得關注的參數：

（C）、"-XX:+UseAdptiveSizePolicy"

      開啓這個參數後，就不用手工指定一些細節參數，如：

      新生代的大小（-Xmn）、Eden與Survivor區的比例（-XX:SurvivorRation）、晉升老年代的對象年齡（-XX:PretenureSizeThreshold）等；

      JVM會根據當前系統運行狀況收集性能監控信息，動態調整這些參數，以提供最合適的停頓時間或最大的吞吐量，這種調節方式稱爲GC自適應的調節策略（GC Ergonomiscs）；

      這是一種值得推薦的方式：

      (1)、只需設置好內存數據大小（如"-Xmx"設置最大堆）；

      (2)、而後使用"-XX:MaxGCPauseMillis"或"-XX:GCTimeRatio"給JVM設置一個優化目標；

      (3)、那些具體細節參數的調節就由JVM自適應完成；

      這也是Parallel Scavenge收集器與ParNew收集器一個重要區別；

      更多目標調優和GC自適應的調節策略說明請參考：

《Memory Management in the Java HotSpot™ Virtual Machine》 5節 Ergonomics -- Automatic Selections and Behavior Tuning： http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

《Java Platform, Standard Edition HotSpot Virtual Machine Garbage Collection Tuning Guide》第2節 Ergonomics： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/ergonomics.html#ergonomics

四、吞吐量與收集器關注點說明

（A）、吞吐量（Throughput）

      CPU用於運行用戶代碼的時間與CPU總消耗時間的比值；

      即吞吐量=運行用戶代碼時間/（運行用戶代碼時間+垃圾收集時間）；

      高吞吐量即減小垃圾收集時間，讓用戶代碼得到更長的運行時間；

（B）、垃圾收集器指望的目標（關注點）

（1）、停頓時間

      停頓時間越短就適合須要與用戶交互的程序；

      良好的響應速度能提高用戶體驗；

（2）、吞吐量

      高吞吐量則能夠高效率地利用CPU時間，儘快完成運算的任務；

      主要適合在後臺計算而不須要太多交互的任務；

（3）、覆蓋區（Footprint）

      在達到前面兩個目標的狀況下，儘可能減小堆的內存空間；

      能夠得到更好的空間局部性；

更多Parallel Scavenge收集器的信息請參考：

      官方的垃圾收集調優指南第6節： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/parallel.html#parallel_collector

上面介紹的都是新生代收集器，接下來開始介紹老年代收集器；

五、Serial Old收集器

      Serial Old是 Serial收集器的老年代版本；

一、特色

      針對老年代；

      採用"標記-整理"算法（還有壓縮，Mark-Sweep-Compact）；

      單線程收集；

      Serial/Serial Old收集器運行示意圖以下：

二、應用場景

      主要用於Client模式；

      而在Server模式有兩大用途：

      （A）、在JDK1.5及以前，與Parallel Scavenge收集器搭配使用（JDK1.6有Parallel Old收集器可搭配）；

      （B）、做爲CMS收集器的後備預案，在併發收集發生Concurrent Mode Failure時使用（後面詳解）；

更多Serial Old收集器信息請參考：

      內存管理白皮書 4.3.2節： http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

六、Parallel Old收集器

      Parallel Old垃圾收集器是Parallel Scavenge收集器的老年代版本；

      JDK1.6中才開始提供；

一、特色

      針對老年代；

      採用"標記-整理"算法；

      多線程收集；

      Parallel Scavenge/Parallel Old收集器運行示意圖以下：

二、應用場景

      JDK1.6及以後用來代替老年代的Serial Old收集器；

      特別是在Server模式，多CPU的狀況下；

      這樣在注重吞吐量以及CPU資源敏感的場景，就有了Parallel Scavenge加Parallel Old收集器的"給力"應用組合；

三、設置參數

      "-XX:+UseParallelOldGC"：指定使用Parallel Old收集器；

更多Parallel Old收集器收集過程介紹請參考：

      《內存管理白皮書》 4.5.2節：         http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

七、CMS收集器

      併發標記清理（Concurrent Mark Sweep，CMS）收集器也稱爲併發低停頓收集器（Concurrent Low Pause Collector）或低延遲（low-latency）垃圾收集器；

      在前面ParNew收集器曾簡單介紹過其特色；

一、特色

      針對老年代；

      基於"標記-清除"算法(不進行壓縮操做，產生內存碎片)；

      以獲取最短回收停頓時間爲目標；

      併發收集、低停頓；

      須要更多的內存（看後面的缺點）；



      是HotSpot在JDK1.5推出的第一款真正意義上的併發（Concurrent）收集器；

      第一次實現了讓垃圾收集線程與用戶線程（基本上）同時工做；

二、應用場景

      與用戶交互較多的場景；

      但願系統停頓時間最短，注重服務的響應速度；

      以給用戶帶來較好的體驗；

      如常見WEB、B/S系統的服務器上的應用；

三、設置參數

"-XX:+UseConcMarkSweepGC"：指定使用CMS收集器；

四、CMS收集器運做過程

比前面幾種收集器更復雜，能夠分爲4個步驟:

（A）、初始標記（CMS initial mark）

      僅標記一下GC Roots能直接關聯到的對象；

      速度很快；

      但須要"Stop The World"；

（B）、併發標記（CMS concurrent mark）

      進行GC Roots Tracing的過程；

      剛纔產生的集合中標記出存活對象；

      應用程序也在運行；

      並不能保證能夠標記出全部的存活對象；

（C）、從新標記（CMS remark）

      爲了修正併發標記期間因用戶程序繼續運做而致使標記變更的那一部分對象的標記記錄；

      須要"Stop The World"，且停頓時間比初始標記稍長，但遠比並發標記短；

      採用多線程並行執行來提高效率；

（D）、併發清除（CMS concurrent sweep）

      回收全部的垃圾對象；

      整個過程當中耗時最長的併發標記和併發清除均可以與用戶線程一塊兒工做；

      因此整體上說，CMS收集器的內存回收過程與用戶線程一塊兒併發執行；

      CMS收集器運行示意圖以下：

五、CMS收集器3個明顯的缺點

（A）、對CPU資源很是敏感

      併發收集雖然不會暫停用戶線程，但由於佔用一部分CPU資源，仍是會致使應用程序變慢，總吞吐量下降。

      CMS的默認收集線程數量是=(CPU數量+3)/4；

      當CPU數量多於4個，收集線程佔用的CPU資源多於25%，對用戶程序影響可能較大；不足4個時，影響更大，可能沒法接受。

      增量式併發收集器：

      針對這種狀況，曾出現了"增量式併發收集器"（Incremental Concurrent Mark Sweep/i-CMS）；

      相似使用搶佔式來模擬多任務機制的思想，讓收集線程和用戶線程交替運行，減小收集線程運行時間；

      但效果並不理想，JDK1.6後就官方再也不提倡用戶使用。

更多請參考：

      官方的《垃圾收集調優指南》8.8節 Incremental Mode： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/cms.html#CJAGIIEJ

      《內存管理白皮書》 4.6.3節能夠看到一些描述；

（B）、沒法處理浮動垃圾,可能出現"Concurrent Mode Failure"失敗

（1）、浮動垃圾（Floating Garbage）

      在併發清除時，用戶線程新產生的垃圾，稱爲浮動垃圾；

      這使得併發清除時須要預留必定的內存空間，不能像其餘收集器在老年代幾乎填滿再進行收集；

      也要能夠認爲CMS所須要的空間比其餘垃圾收集器大；

      "-XX:CMSInitiatingOccupancyFraction"：設置CMS預留內存空間；

      JDK1.5默認值爲68%；

      JDK1.6變爲大約92%；

（2）、"Concurrent Mode Failure"失敗

      若是CMS預留內存空間沒法知足程序須要，就會出現一次"Concurrent Mode Failure"失敗；

      這時JVM啓用後備預案：臨時啓用Serail Old收集器，而致使另外一次Full GC的產生；

      這樣的代價是很大的，因此CMSInitiatingOccupancyFraction不能設置得太大。

（C）、產生大量內存碎片

      因爲CMS基於"標記-清除"算法，清除後不進行壓縮操做；

      前面《Java虛擬機垃圾回收(二) 垃圾回收算法》"標記-清除"算法介紹時曾說過：

      產生大量不連續的內存碎片會致使分配大內存對象時，沒法找到足夠的連續內存，從而須要提早觸發另外一次Full GC動做。

      解決方法：

（1）、"-XX:+UseCMSCompactAtFullCollection"

      使得CMS出現上面這種狀況時不進行Full GC，而開啓內存碎片的合併整理過程；

      但合併整理過程沒法併發，停頓時間會變長；

      默認開啓（但不會進行，結合下面的CMSFullGCsBeforeCompaction）；

（2）、"-XX:+CMSFullGCsBeforeCompaction"

      設置執行多少次不壓縮的Full GC後，來一次壓縮整理；

      爲減小合併整理過程的停頓時間；

      默認爲0，也就是說每次都執行Full GC，不會進行壓縮整理；

      因爲空間再也不連續，CMS須要使用可用"空閒列表"內存分配方式，這比簡單實用"碰撞指針"分配內存消耗大；

      更多關於內存分配方式請參考：《 Java對象在Java虛擬機中的建立過程》

      整體來看，與Parallel Old垃圾收集器相比，CMS減小了執行老年代垃圾收集時應用暫停的時間；

      但卻增長了新生代垃圾收集時應用暫停的時間、下降了吞吐量並且須要佔用更大的堆空間；

更多CMS收集器信息請參考：

《垃圾收集調優指南》 8節 Concurrent Mark Sweep (CMS) Collector： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/cms.html#concurrent_mark_sweep_cms_collector

《內存管理白皮書》 4.6節 Concurrent Mark-Sweep (CMS) Collector： http://www.oracle.com/technetwork/java/javase/tech/memorymanagement-whitepaper-1-150020.pdf

八、G1收集器

G1（Garbage-First）是JDK7-u4才推出商用的收集器；

一、特色

（A）、並行與併發

      能充分利用多CPU、多核環境下的硬件優點；

      能夠並行來縮短"Stop The World"停頓時間；

      也能夠併發讓垃圾收集與用戶程序同時進行；

（B）、分代收集，收集範圍包括新生代和老年代

      能獨立管理整個GC堆（新生代和老年代），而不須要與其餘收集器搭配；

      可以採用不一樣方式處理不一樣時期的對象；



      雖然保留分代概念，但Java堆的內存佈局有很大差異；

      將整個堆劃分爲多個大小相等的獨立區域（Region）；

      新生代和老年代再也不是物理隔離，它們都是一部分Region（不須要連續）的集合；

      更多G1內存佈局信息請參考：

      《垃圾收集調優指南》 9節： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc.html#garbage_first_garbage_collection

（C）、結合多種垃圾收集算法，空間整合，不產生碎片

      從總體看，是基於標記-整理算法；

      從局部（兩個Region間）看，是基於複製算法；

      這是一種相似火車算法的實現；

      都不會產生內存碎片，有利於長時間運行；

（D）、可預測的停頓：低停頓的同時實現高吞吐量

      G1除了追求低停頓處，還能創建可預測的停頓時間模型；

      能夠明確指定M毫秒時間片內，垃圾收集消耗的時間不超過N毫秒；

二、應用場景

      面向服務端應用，針對具備大內存、多處理器的機器；

      最主要的應用是爲須要低GC延遲，並具備大堆的應用程序提供解決方案；

      如：在堆大小約6GB或更大時，可預測的暫停時間能夠低於0.5秒；



      用來替換掉JDK1.5中的CMS收集器；

      在下面的狀況時，使用G1可能比CMS好：

      （1）、超過50％的Java堆被活動數據佔用；

      （2）、對象分配頻率或年代提高頻率變化很大；

      （3）、GC停頓時間過長（長於0.5至1秒）。

      是否必定採用G1呢？也未必：

      若是如今採用的收集器沒有出現問題，不用急着去選擇G1；

      若是應用程序追求低停頓，能夠嘗試選擇G1；

      是否代替CMS須要實際場景測試才知道。

三、設置參數

      "-XX:+UseG1GC"：指定使用G1收集器；

      "-XX:InitiatingHeapOccupancyPercent"：當整個Java堆的佔用率達到參數值時，開始併發標記階段；默認爲45；

      "-XX:MaxGCPauseMillis"：爲G1設置暫停時間目標，默認值爲200毫秒；

      "-XX:G1HeapRegionSize"：設置每一個Region大小，範圍1MB到32MB；目標是在最小Java堆時能夠擁有約2048個Region；

      更多關於G1參數設置請參考：

      《垃圾收集調優指南》 10.5節： http://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/g1_gc_tuning.html#important_defaults

四、爲何G1收集器能夠實現可預測的停頓

      G1能夠創建可預測的停頓時間模型，是由於：

      能夠有計劃地避免在Java堆的進行全區域的垃圾收集；

      G1跟蹤各個Region得到其收集價值大小，在後臺維護一個優先列表；

      每次根據容許的收集時間，優先回收價值最大的Region（名稱Garbage-First的由來）；

      這就保證了在有限的時間內能夠獲取儘量高的收集效率；

五、一個對象被不一樣區域引用的問題

      一個Region不多是孤立的，一個Region中的對象可能被其餘任意Region中對象引用，判斷對象存活時，是否須要掃描整個Java堆才能保證準確？

      在其餘的分代收集器，也存在這樣的問題（而G1更突出）：

      回收新生代也不得不一樣時掃描老年代？

      這樣的話會下降Minor GC的效率；

      解決方法：

      不管G1仍是其餘分代收集器，JVM都是使用Remembered Set來避免全局掃描：

      每一個Region都有一個對應的Remembered Set；

      每次Reference類型數據寫操做時，都會產生一個Write Barrier暫時中斷操做；

      而後檢查將要寫入的引用指向的對象是否和該Reference類型數據在不一樣的Region（其餘收集器：檢查老年代對象是否引用了新生代對象）；

      若是不一樣，經過CardTable把相關引用信息記錄到引用指向對象的所在Region對應的Remembered Set中；



      當進行垃圾收集時，在GC根節點的枚舉範圍加入Remembered Set；

      就能夠保證不進行全局掃描，也不會有遺漏。

六、G1收集器運做過程

不計算維護Remembered Set的操做，能夠分爲4個步驟（與CMS較爲類似）。

（A）、初始標記（Initial Marking）

      僅標記一下GC Roots能直接關聯到的對象；

      且修改TAMS（Next Top at Mark Start）,讓下一階段併發運行時，用戶程序能在正確可用的Region中建立新對象；

      須要"Stop The World"，但速度很快；

（B）、併發標記（Concurrent Marking）

      進行GC Roots Tracing的過程；

      剛纔產生的集合中標記出存活對象；

      耗時較長，但應用程序也在運行；

      並不能保證能夠標記出全部的存活對象；

（C）、最終標記（Final Marking）

      爲了修正併發標記期間因用戶程序繼續運做而致使標記變更的那一部分對象的標記記錄；

      上一階段對象的變化記錄在線程的Remembered Set Log；

      這裏把Remembered Set Log合併到Remembered Set中；



      須要"Stop The World"，且停頓時間比初始標記稍長，但遠比並發標記短；

      採用多線程並行執行來提高效率；

（D）、篩選回收（Live Data Counting and Evacuation）

      首先排序各個Region的回收價值和成本；

      而後根據用戶指望的GC停頓時間來制定回收計劃；

      最後按計劃回收一些價值高的Region中垃圾對象；



      回收時採用"複製"算法，從一個或多個Region複製存活對象到堆上的另外一個空的Region，而且在此過程當中壓縮和釋放內存；

      能夠併發進行，下降停頓時間，並增長吞吐量；