扒一扒JVM的垃圾回收機制,下次面試你準備好了嗎

  相信和小編同樣的程序猿們在平常工做或面試當中常常會遇到JVM的垃圾回收問題,有沒有在夜深人靜的時候詳細捋一捋JVM垃圾回收機制中的知識點呢?沒時間捋也不要緊,由於小編接下來會給你捋一捋。java

<!-- TOC -->面試

<!-- /TOC -->算法

##1、 技術背景你要了解吧   按照套路是要先裝裝X,談談JVM垃圾回收的前世此生的。提及垃圾回收(GC),大部分人都把這項技術當作Java語言的伴生產物。事實上,GC的歷史比Java久遠,早在1960年Lisp這門語言中就使用了內存動態分配和垃圾回收技術。設計和優化C++這門語言的專家們要長點心啦~~多線程

##2、 哪些內存須要回收?   猿們都知道JVM的內存結構包括五大區域:程序計數器、虛擬機棧、本地方法棧、堆區、方法區。其中程序計數器、虛擬機棧、本地方法棧3個區域隨線程而生、隨線程而滅,所以這幾個區域的內存分配和回收都具有肯定性,就不須要過多考慮回收的問題,由於方法結束或者線程結束時,內存天然就跟隨着回收了。而Java堆區和方法區則不同、不同!(怎麼不同說的朗朗上口),這部份內存的分配和回收是動態的,正是垃圾收集器所需關注的部分。併發

  垃圾收集器在對堆區和方法區進行回收前,首先要肯定這些區域的對象哪些能夠被回收,哪些暫時還不能回收,這就要用到判斷對象是否存活的算法!(面試官確定沒少問你吧)高併發

###2.1 引用計數算法 ####2.1.1 算法分析   引用計數是垃圾收集器中的早期策略。在這種方法中,堆中每一個對象實例都有一個引用計數。當一個對象被建立時,就將該對象實例分配給一個變量,該變量計數設置爲1。當任何其它變量被賦值爲這個對象的引用時,計數加1(a = b,則b引用的對象實例的計數器+1),但當一個對象實例的某個引用超過了生命週期或者被設置爲一個新值時,對象實例的引用計數器減1。任何引用計數器爲0的對象實例能夠被看成垃圾收集。當一個對象實例被垃圾收集時,它引用的任何對象實例的引用計數器減1。 ####2.1.2 優缺點 優勢:引用計數收集器能夠很快的執行,交織在程序運行中。對程序須要不被長時間打斷的實時環境比較有利。優化

缺點:沒法檢測出循環引用。如父對象有一個對子對象的引用,子對象反過來引用父對象。這樣,他們的引用計數永遠不可能爲0。 ####2.1.3 是否是很無趣,來段代碼壓壓驚線程

public class ReferenceFindTest {
    public static void main(String[] args) {
        MyObject object1 = new MyObject();
        MyObject object2 = new MyObject();
          
        object1.object = object2;
        object2.object = object1;
          
        object1 = null;
        object2 = null;
    }
}

  這段代碼是用來驗證引用計數算法不能檢測出循環引用。最後面兩句將object1object2賦值爲null,也就是說object1object2指向的對象已經不可能再被訪問,可是因爲它們互相引用對方,致使它們的引用計數器都不爲0,那麼垃圾收集器就永遠不會回收它們。設計

###2.2 可達性分析算法   可達性分析算法是從離散數學中的圖論引入的,程序把全部的引用關係看做一張圖,從一個節點GC ROOT開始,尋找對應的引用節點,找到這個節點之後,繼續尋找這個節點的引用節點,當全部的引用節點尋找完畢以後,剩餘的節點則被認爲是沒有被引用到的節點,即無用的節點,無用的節點將會被斷定爲是可回收的對象。3d

  在Java語言中,可做爲GC Roots的對象包括下面幾種:

  a) 虛擬機棧中引用的對象(棧幀中的本地變量表);

  b) 方法區中類靜態屬性引用的對象;

  c) 方法區中常量引用的對象;

  d) 本地方法棧中JNI(Native方法)引用的對象。 ###2.3 Java中的引用你瞭解多少   不管是經過引用計數算法判斷對象的引用數量,仍是經過可達性分析算法判斷對象的引用鏈是否可達,斷定對象是否存活都與「引用」有關。在Java語言中,將引用又分爲強引用、軟引用、弱引用、虛引用4種,這四種引用強度依次逐漸減弱。

  • <font color=#0099ff size=4 face="黑體">強引用</font>

  在程序代碼中廣泛存在的,相似 Object obj = new Object() 這類引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的對象。

  • <font color=#0099ff size=4 face="黑體">軟引用</font>

  用來描述一些還有用但並不是必須的對象。對於軟引用關聯着的對象,在系統將要發生內存溢出異常以前,將會把這些對象列進回收範圍之中進行第二次回收。若是此次回收後尚未足夠的內存,纔會拋出內存溢出異常。

  • <font color=#0099ff size=4 face="黑體">弱引用</font>

  也是用來描述非必需對象的,可是它的強度比軟引用更弱一些,被弱引用關聯的對象只能生存到下一次垃圾收集發生以前。當垃圾收集器工做時,不管當前內存是否足夠,都會回收掉只被弱引用關聯的對象。

  • <font color=#0099ff size=4 face="黑體">虛引用</font>

  也叫幽靈引用或幻影引用(名字真會取,很魔幻的樣子),是最弱的一種引用關係。一個對象是否有虛引用的存在,徹底不會對其生存時間構成影響,也沒法經過虛引用來取得一個對象實例。它的做用是能在這個對象被收集器回收時收到一個系統通知。

  不要被概念嚇到,也別擔憂,還沒跑題,再深刻,可就很差說了。小編羅列這四個概念的目的是爲了說明,不管引用計數算法仍是可達性分析算法都是基於強引用而言的。

###2.4 對象死亡(被回收)前的最後一次掙扎   即便在可達性分析算法中不可達的對象,也並不是是「非死不可」,這時候它們暫時處於「緩刑」階段,要真正宣告一個對象死亡,至少要經歷兩次標記過程。

  第一次標記:若是對象在進行可達性分析後發現沒有與GC Roots相鏈接的引用鏈,那它將會被第一次標記;

  第二次標記:第一次標記後接着會進行一次篩選,篩選的條件是此對象是否有必要執行finalize()方法。在finalize()方法中沒有從新與引用鏈創建關聯關係的,將被進行第二次標記。

  第二次標記成功的對象將真的會被回收,若是對象在finalize()方法中從新與引用鏈創建了關聯關係,那麼將會逃離本次回收,繼續存活。猿們還跟的上吧,嘿嘿。

###2.5 方法區如何判斷是否須要回收   猿們,方法區存儲內容是否須要回收的判斷可就不同咯。方法區主要回收的內容有:廢棄常量和無用的類。對於廢棄常量也可經過引用的可達性來判斷,可是對於無用的類則須要同時知足下面3個條件:

  • 該類全部的實例都已經被回收,也就是Java堆中不存在該類的任何實例;
  • 加載該類的ClassLoader已經被回收;
  • 該類對應的java.lang.Class對象沒有在任何地方被引用,沒法在任何地方經過反射訪問該類的方法。

<br/> <font color=#0099ff size=5 face="黑體">講了半天,主角終於要粉墨登場了。</font>

<br/>

##3、經常使用的垃圾收集算法 ###3.1 標記-清除算法   標記-清除算法採用從根集合(GC Roots)進行掃描,對存活的對象進行標記,標記完畢後,再掃描整個空間中未被標記的對象,進行回收,以下圖所示。標記-清除算法不須要進行對象的移動,只需對不存活的對象進行處理,在存活對象比較多的狀況下極爲高效,但因爲標記-清除算法直接回收不存活的對象,所以會形成內存碎片。

###3.2 複製算法   複製算法的提出是爲了克服句柄的開銷和解決內存碎片的問題。它開始時把堆分紅 一個對象 面和多個空閒面, 程序從對象面爲對象分配空間,當對象滿了,基於copying算法的垃圾 收集就從根集合(GC Roots)中掃描活動對象,並將每一個 活動對象複製到空閒面(使得活動對象所佔的內存之間沒有空閒洞),這樣空閒面變成了對象面,原來的對象面變成了空閒面,程序會在新的對象面中分配內存。

###3.3 標記-整理算法   標記-整理算法採用標記-清除算法同樣的方式進行對象的標記,但在清除時不一樣,在回收不存活的對象佔用的空間後,會將全部的存活對象往左端空閒空間移動,並更新對應的指針。標記-整理算法是在標記-清除算法的基礎上,又進行了對象的移動,所以成本更高,可是卻解決了內存碎片的問題。具體流程見下圖:

###3.4 分代收集算法   分代收集算法是目前大部分JVM的垃圾收集器採用的算法。它的核心思想是根據對象存活的生命週期將內存劃分爲若干個不一樣的區域。通常狀況下將堆區劃分爲老年代(Tenured Generation)和新生代(Young Generation),在堆區以外還有一個代就是永久代(Permanet Generation)。老年代的特色是每次垃圾收集時只有少許對象須要被回收,而新生代的特色是每次垃圾回收時都有大量的對象須要被回收,那麼就能夠根據不一樣代的特色採起最適合的收集算法。

####3.4.1 年輕代(Young Generation)的回收算法

a) 全部新生成的對象首先都是放在年輕代的。年輕代的目標就是儘量快速的收集掉那些生命週期短的對象。

b) 新生代內存按照8:1:1的比例分爲一個eden區和兩個survivor(survivor0,survivor1)區。一個Eden區,兩個 Survivor區(通常而言)。大部分對象在Eden區中生成。回收時先將eden區存活對象複製到一個survivor0區,而後清空eden區,當這個survivor0區也存放滿了時,則將eden區和survivor0區存活對象複製到另外一個survivor1區,而後清空eden和這個survivor0區,此時survivor0區是空的,而後將survivor0區和survivor1區交換,即保持survivor1區爲空, 如此往復。

c) 當survivor1區不足以存放 eden和survivor0的存活對象時,就將存活對象直接存放到老年代。如果老年代也滿了就會觸發一次Full GC,也就是新生代、老年代都進行回收。

d) 新生代發生的GC也叫作Minor GC,MinorGC發生頻率比較高(不必定等Eden區滿了才觸發)。 ####3.4.2 年老代(Old Generation)的回收算法 a) 在年輕代中經歷了N次垃圾回收後仍然存活的對象,就會被放到年老代中。所以,能夠認爲年老代中存放的都是一些生命週期較長的對象。

b) 內存比新生代也大不少(大概比例是1:2),當老年代內存滿時觸發Major GC即Full GC,Full GC發生頻率比較低,老年代對象存活時間比較長,存活率標記高。 ####3.4.3 持久代(Permanent Generation)的回收算法   用於存放靜態文件,如Java類、方法等。持久代對垃圾回收沒有顯著影響,可是有些應用可能動態生成或者調用一些class,例如Hibernate 等,在這種時候須要設置一個比較大的持久代空間來存放這些運行過程當中新增的類。持久代也稱方法區,具體的回收可參見上文2.5節。

<br/> <font color=#0099ff size=5 face="黑體">猿們加油跟上,離offer不遠啦!!!</font>

<br/> ##4、常見的垃圾收集器 下面一張圖是HotSpot虛擬機包含的全部收集器,圖是借用過來滴:

  • Serial收集器(複製算法) 新生代單線程收集器,標記和清理都是單線程,優勢是簡單高效。是client級別默認的GC方式,能夠經過-XX:+UseSerialGC來強制指定。
  • Serial Old收集器(標記-整理算法) 老年代單線程收集器,Serial收集器的老年代版本。
  • ParNew收集器(中止-複製算法)  新生代收集器,能夠認爲是Serial收集器的多線程版本,在多核CPU環境下有着比Serial更好的表現。
  • Parallel Scavenge收集器(中止-複製算法) 並行收集器,追求高吞吐量,高效利用CPU。吞吐量通常爲99%, 吞吐量= 用戶線程時間/(用戶線程時間+GC線程時間)。適合後臺應用等對交互相應要求不高的場景。是server級別默認採用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數。
  • Parallel Old收集器(中止-複製算法) Parallel Scavenge收集器的老年代版本,並行收集器,吞吐量優先。
  • CMS(Concurrent Mark Sweep)收集器(標記-清理算法) 高併發、低停頓,追求最短GC回收停頓時間,cpu佔用比較高,響應時間快,停頓時間短,多核cpu 追求高響應時間的選擇。

##5、GC是何時觸發的(面試最多見的問題之一)   因爲對象進行了分代處理,所以垃圾回收區域、時間也不同。GC有兩種類型:Scavenge GC和Full GC。 ###5.1 Scavenge GC   通常狀況下,當新對象生成,而且在Eden申請空間失敗時,就會觸發Scavenge GC,對Eden區域進行GC,清除非存活對象,而且把尚且存活的對象移動到Survivor區。而後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。由於大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,因此Eden區的GC會頻繁進行。於是,通常在這裏須要使用速度快、效率高的算法,使Eden去能儘快空閒出來。 ###5.2 Full GC   對整個堆進行整理,包括Young、Tenured和Perm。Full GC由於須要對整個堆進行回收,因此比Scavenge GC要慢,所以應該儘量減小Full GC的次數。在對JVM調優的過程當中,很大一部分工做就是對於Full GC的調節。有以下緣由可能致使Full GC:

a) 年老代(Tenured)被寫滿;

b) 持久代(Perm)被寫滿;

c) System.gc()被顯示調用;

d) 上一次GC以後Heap的各域分配策略動態變化;

##結束語

  內容的完整度和深度在一篇博文裏面真的很難所有考慮,本文作了很大嘗試,最後仍是得投降。對於各個垃圾收集器的區別、運行過程當中各內存區域參數的設置、GC日誌的查看等內容後續再補上吧。文章概念不少,也借用了一些書籍和博文的經典總結,算是一個知識點整理後的輸出吧,但願對你們有所裨益。

相關文章
相關標籤/搜索