Java垃圾回收機制

時間 2019-11-21

標籤 java 垃圾回收機制欄目 Java 简体版

原文原文鏈接

Java垃圾回收機制html

　　說到垃圾回收（Garbage Collection，GC），不少人就會天然而然地把它和Java聯繫起來。在Java中，程序員不須要去關心內存動態分配和垃圾回收的問題，這一切都交給了JVM來處理。顧名思義，垃圾回收就是釋放垃圾佔用的空間，那麼在Java中，什麼樣的對象會被認定爲「垃圾」？那麼當一些對象被肯定爲垃圾以後，採用什麼樣的策略來進行回收（釋放空間）？在目前的商業虛擬機中，有哪些典型的垃圾收集器？下面咱們就來逐一探討這些問題。如下是本文的目錄大綱：java

　　一.如何肯定某個對象是「垃圾」？程序員

　　二.典型的垃圾收集算法算法

　　三.典型的垃圾收集器數組

　　若是有不正之處，但願諒解和批評指正，不勝感激。多線程

　　請尊重做者勞動成果，轉載請標明原文連接：併發

　　http://www.cnblogs.com/dolphin0520/p/3783345.htmlspa

一.如何肯定某個對象是「垃圾」？

　　在這一小節咱們先了解一個最基本的問題：若是肯定某個對象是「垃圾」？既然垃圾收集器的任務是回收垃圾對象所佔的空間供新的對象使用，那麼垃圾收集器如何肯定某個對象是「垃圾」？—即經過什麼方法判斷一個對象能夠被回收了。線程

　　在java中是經過引用來和對象進行關聯的，也就是說若是要操做對象，必須經過引用來進行。那麼很顯然一個簡單的辦法就是經過引用計數來判斷一個對象是否能夠被回收。不失通常性，若是一個對象沒有任何引用與之關聯，則說明該對象基本不太可能在其餘地方被使用到，那麼這個對象就成爲可被回收的對象了。這種方式成爲引用計數法。3d

　　這種方式的特色是實現簡單，並且效率較高，可是它沒法解決循環引用的問題，所以在Java中並無採用這種方式（Python採用的是引用計數法）。看下面這段代碼：

public class Main {

public static void main(String[] args) {

MyObject object1 = new MyObject();

MyObject object2 = new MyObject();

object1.object = object2;

object2.object = object1;

object1 = null;

object2 = null;

}

class MyObject{

public Object object = null;

}

　　最後面兩句將object1和object2賦值爲null，也就是說object1和object2指向的對象已經不可能再被訪問，可是因爲它們互相引用對方，致使它們的引用計數都不爲0，那麼垃圾收集器就永遠不會回收它們。

　　爲了解決這個問題，在Java中採起了可達性分析法。該方法的基本思想是經過一系列的「GC Roots」對象做爲起點進行搜索，若是在「GC Roots」和一個對象之間沒有可達路徑，則稱該對象是不可達的，不過要注意的是被斷定爲不可達的對象不必定就會成爲可回收對象。被斷定爲不可達的對象要成爲可回收對象必須至少經歷兩次標記過程，若是在這兩次標記過程當中仍然沒有逃脫成爲可回收對象的可能性，則基本上就真的成爲可回收對象了。

　　至於可達性分析法具體是如何操做的我暫時也沒有看得很明白，若是有哪位朋友比較清楚的話請不吝指教。

　　下面來看個例子：

Object aobj = new Object ( ) ;

Object bobj = new Object ( ) ;

Object cobj = new Object ( ) ;

aobj = bobj;

aobj = cobj;

cobj = null;

aobj = null;

　　第幾行有可能會使得某個對象成爲可回收對象？第7行的代碼會致使有對象會成爲可回收對象。至於爲何留給讀者本身思考。

　　再看一個例子：

String str = new String("hello");

SoftReference<String> sr = new SoftReference<String>(new String("java"));

WeakReference<String> wr = new WeakReference<String>(new String("world"));

　　這三句哪句會使得String對象成爲可回收對象？第2句和第3句，第2句在內存不足的狀況下會將String對象斷定爲可回收對象，第3句不管什麼狀況下String對象都會被斷定爲可回收對象。

　　最後總結一下日常遇到的比較常見的將對象斷定爲可回收對象的狀況：

　　1）顯示地將某個引用賦值爲null或者將已經指向某個對象的引用指向新的對象，好比下面的代碼：

Object obj = new Object();

obj = null;

Object obj1 = new Object();

Object obj2 = new Object();

obj1 = obj2;

　　　　2）局部引用所指向的對象，好比下面這段代碼：

void fun() {

.....

for(int i=0;i<10;i++) {

Object obj = new Object();

System.out.println(obj.getClass());

}

　　循環每執行完一次，生成的Object對象都會成爲可回收的對象。

　　3）只有弱引用與其關聯的對象，好比：

1	`WeakReference<String> wr =` `new` `WeakReference<String>(new` `String("world"));`

二.典型的垃圾收集算法

　　在肯定了哪些垃圾能夠被回收後，垃圾收集器要作的事情就是開始進行垃圾回收，可是這裏面涉及到一個問題是：如何高效地進行垃圾回收。因爲Java虛擬機規範並無對如何實現垃圾收集器作出明確的規定，所以各個廠商的虛擬機能夠採用不一樣的方式來實現垃圾收集器，因此在此只討論幾種常見的垃圾收集算法的核心思想。

　　1.Mark-Sweep（標記-清除）算法

　　這是最基礎的垃圾回收算法，之因此說它是最基礎的是由於它最容易實現，思想也是最簡單的。標記-清除算法分爲兩個階段：標記階段和清除階段。標記階段的任務是標記出全部須要被回收的對象，清除階段就是回收被標記的對象所佔用的空間。具體過程以下圖所示：

　　從圖中能夠很容易看出標記-清除算法實現起來比較容易，可是有一個比較嚴重的問題就是容易產生內存碎片，碎片太多可能會致使後續過程當中須要爲大對象分配空間時沒法找到足夠的空間而提早觸發新的一次垃圾收集動做。

　　2.Copying（複製）算法

　　爲了解決Mark-Sweep算法的缺陷，Copying算法就被提了出來。它將可用內存按容量劃分爲大小相等的兩塊，每次只使用其中的一塊。當這一塊的內存用完了，就將還存活着的對象複製到另一塊上面，而後再把已使用的內存空間一次清理掉，這樣一來就不容易出現內存碎片的問題。具體過程以下圖所示：

　　這種算法雖然實現簡單，運行高效且不容易產生內存碎片，可是卻對內存空間的使用作出了高昂的代價，由於可以使用的內存縮減到原來的一半。

　　很顯然，Copying算法的效率跟存活對象的數目多少有很大的關係，若是存活對象不少，那麼Copying算法的效率將會大大下降。

　　3.Mark-Compact（標記-整理）算法

　　爲了解決Copying算法的缺陷，充分利用內存空間，提出了Mark-Compact算法。該算法標記階段和Mark-Sweep同樣，可是在完成標記以後，它不是直接清理可回收對象，而是將存活對象都向一端移動，而後清理掉端邊界之外的內存。具體過程以下圖所示：

　　4.Generational Collection（分代收集）算法

　　分代收集算法是目前大部分JVM的垃圾收集器採用的算法。它的核心思想是根據對象存活的生命週期將內存劃分爲若干個不一樣的區域。通常狀況下將堆區劃分爲老年代（Tenured Generation）和新生代（Young Generation），老年代的特色是每次垃圾收集時只有少許對象須要被回收，而新生代的特色是每次垃圾回收時都有大量的對象須要被回收，那麼就能夠根據不一樣代的特色採起最適合的收集算法。

　　目前大部分垃圾收集器對於新生代都採起Copying算法，由於新生代中每次垃圾回收都要回收大部分對象，也就是說須要複製的操做次數較少，可是實際中並非按照1：1的比例來劃分新生代的空間的，通常來講是將新生代劃分爲一塊較大的Eden空間和兩塊較小的Survivor空間，每次使用Eden空間和其中的一塊Survivor空間，當進行回收時，將Eden和Survivor中還存活的對象複製到另外一塊Survivor空間中，而後清理掉Eden和剛纔使用過的Survivor空間。

　　而因爲老年代的特色是每次回收都只回收少許對象，通常使用的是Mark-Compact算法。

　　注意，在堆區以外還有一個代就是永久代（Permanet Generation），它用來存儲class類、常量、方法描述等。對永久代的回收主要回收兩部份內容：廢棄常量和無用的類。

三.典型的垃圾收集器

　　垃圾收集算法是內存回收的理論基礎，而垃圾收集器就是內存回收的具體實現。下面介紹一下HotSpot（JDK 7)虛擬機提供的幾種垃圾收集器，用戶能夠根據本身的需求組合出各個年代使用的收集器。

　　1.Serial/Serial Old

　　Serial/Serial Old收集器是最基本最古老的收集器，它是一個單線程收集器，而且在它進行垃圾收集時，必須暫停全部用戶線程。Serial收集器是針對新生代的收集器，採用的是Copying算法，Serial Old收集器是針對老年代的收集器，採用的是Mark-Compact算法。它的優勢是實現簡單高效，可是缺點是會給用戶帶來停頓。

　　2.ParNew

　　ParNew收集器是Serial收集器的多線程版本，使用多個線程進行垃圾收集。

　　3.Parallel Scavenge

　　Parallel Scavenge收集器是一個新生代的多線程收集器（並行收集器），它在回收期間不須要暫停其餘用戶線程，其採用的是Copying算法，該收集器與前兩個收集器有所不一樣，它主要是爲了達到一個可控的吞吐量。

　　4.Parallel Old

　　Parallel Old是Parallel Scavenge收集器的老年代版本（並行收集器），使用多線程和Mark-Compact算法。

　　5.CMS

　　CMS（Current Mark Sweep）收集器是一種以獲取最短回收停頓時間爲目標的收集器，它是一種併發收集器，採用的是Mark-Sweep算法。

　　6.G1

　　G1收集器是當今收集器技術發展最前沿的成果，它是一款面向服務端應用的收集器，它能充分利用多CPU、多核環境。所以它是一款並行與併發收集器，而且它能創建可預測的停頓時間模型。

　　下面補充一下關於內存分配方面的東西：

　　對象的內存分配，往大方向上講就是在堆上分配，對象主要分配在新生代的Eden Space和From Space，少數狀況下會直接分配在老年代。若是新生代的Eden Space和From Space的空間不足，則會發起一次GC，若是進行了GC以後，Eden Space和From Space可以容納該對象就放在Eden Space和From Space。在GC的過程當中，會將Eden Space和From Space中的存活對象移動到To Space，而後將Eden Space和From Space進行清理。若是在清理的過程當中，To Space沒法足夠來存儲某個對象，就會將該對象移動到老年代中。在進行了GC以後，使用的即是Eden space和To Space了，下次GC時會將存活對象複製到From Space，如此反覆循環。當對象在Survivor區躲過一次GC的話，其對象年齡便會加1，默認狀況下，若是對象年齡達到15歲，就會移動到老年代中。

　　通常來講，大對象會被直接分配到老年代，所謂的大對象是指須要大量連續存儲空間的對象，最多見的一種大對象就是大數組，好比：

　　byte[] data = new byte[4*1024*1024]

　　這種通常會直接在老年代分配存儲空間。

　　固然分配的規則並非百分之百固定的，這要取決於當前使用的是哪一種垃圾收集器組合和JVM的相關參數。

　　參考資料：

　　《深刻理解Java虛擬機》