深刻理解Java虛擬機筆記之三對象存活斷定算法與垃圾收集算法

對象存活斷定算法

引用計數法

給對象中添加一個引用計數器,每當有一個地方引用它時,計數器值就加1;當引用失效時,計數器值就減1;任什麼時候刻計數器爲0的對象就是不可能再被使用。java

引用計數算法的實現簡單,斷定效率也很高,在大部分狀況下他都是一個不錯的算法,可是,至少主流的Java虛擬機裏面沒有選用引用計數算法來管理內存,其中最主要的緣由是他很難解決對象之間相互循環引用的問題。算法

public class ReferenceCountingGC {

    public  Object instance = null;
    private static final int _1MB = 1024*1024;

    private byte[] bigSize = new byte[2*_1MB];

    public static void testGC(){
        ReferenceCountingGC objA = new ReferenceCountingGC();
        ReferenceCountingGC objB = new ReferenceCountingGC();
        objA.instance = objB;
        objB.instance = objA;

        objA = null;
        objB = null;

        System.gc();
    }

    public static void main(String[] args) {
        testGC();
    }
}


[GC (System.gc()) [PSYoungGen: 9343K->824K(76288K)] 9343K->832K(251392K), 0.0006888 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[Full GC (System.gc()) [PSYoungGen: 824K->0K(76288K)] [ParOldGen: 8K->630K(175104K)] 832K->630K(251392K), [Metaspace: 3448K->3448K(1056768K)], 0.0039029 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap
 PSYoungGen      total 76288K, used 1966K [0x000000076b000000, 0x0000000770500000, 0x00000007c0000000)
  eden space 65536K, 3% used [0x000000076b000000,0x000000076b1eb9e0,0x000000076f000000)
  from space 10752K, 0% used [0x000000076f000000,0x000000076f000000,0x000000076fa80000)
  to   space 10752K, 0% used [0x000000076fa80000,0x000000076fa80000,0x0000000770500000)
 ParOldGen       total 175104K, used 630K [0x00000006c1000000, 0x00000006cbb00000, 0x000000076b000000)
  object space 175104K, 0% used [0x00000006c1000000,0x00000006c109d908,0x00000006cbb00000)
 Metaspace       used 3463K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 380K, capacity 388K, committed 512K, reserved 1048576K
  
複製代碼

可達性分析算法

在主流的商用程序語言(Java、C#)的主流實現中,都是經過可達性分析來斷定對象是否存活的。這個算法的基本思路就是經過一系列的成爲「GC Roots」的對象做爲起始點,從這些節點開始向下搜索,搜索,搜索所走過的路徑稱爲引用鏈,當一個對象到GC Roots沒有任何引用鏈相連時,則證實對象是不可用的。bash

對象object五、object六、object7雖然互有關聯,可是它們到GC Roots是不可達的,因此他們將會被斷定是可回收的對象。

在Java語言中,可做爲GC Roots的對象包括下面幾種:ui

  • 虛擬機棧(棧幀中的本地變量表)中引用的對象
  • 方法區中類靜態屬性引用的對象
  • 方法區中常量引用的對象
  • 本地方法棧中JNI(Native方法)引用的對象

引用

  • 強引用spa

    指在程序代碼中廣泛存在的,相似Object obj = new Object()這類的引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的對象線程

  • 軟引用3d

    用來描述一些還有用但並不是必需的對象。對於引用關聯着的對象,在系統將要發生內存溢出異常以前,將會把這些對象列進回收範圍之中進行第二次回收。若是此次回收尚未足夠的內存,纔會拋出內存溢出異常。指針

  • 弱引用code

    用來描述非必需對象的,可是它的強度比軟引用更弱一些,被弱引用關聯的對象只能生存到下一次垃圾收集發生以前。當垃圾收集器工做時,不管當前內存是否足夠,都會回收掉只被弱引用關聯的對象。cdn

  • 虛引用

    虛引用也稱爲幽靈引用或者幻影引用,它是最弱的一種引用關係。一個對象是否有虛引用的存在,徹底不會對其生存時間構成影響,也沒法經過虛引用來取得一個對象實例。爲一個對象設置虛引用關聯的惟一目的就是能在這個對象被收集器回收時收到一個系統通知。

即便在可達性分析算法中不可達的對象,也並不是是「非死不可」的,這時候它們暫時處於「緩刑」階段,要真正宣告一個對象死亡,至少要經歷兩次標記過程:

若是對象在進行可達性分析後發現沒有與GC Roots相鏈接的引用鏈,那它將會被第一次標記而且進行一次篩選,篩選的條件是此對象是否有必要執行finalize()方法。若是對象沒有副高finalize()方法或者finalize()方法以及被虛擬機調用過,虛擬機將這兩種狀況都視爲「沒有必要執行」。

若是這個對象被斷定爲有必要執行finalize()方法,那麼這個對象將會放置在一個F-Queue的隊列中。稍後由一個由虛擬機自動創建的,低優先級的Finalizer線程去執行它。

finalize()方法虛擬機只會執行一次。

回收方法區

在方法區中進行垃圾收集的性價比比較低,在堆中,尤爲是新生代,常規應用進行一次垃圾收集通常能夠回收70%-95%的空間,而永久代的垃圾收集效率遠低於此。

永久代的垃圾收集主要回收兩個部分:廢棄常量和無用的類。

回收廢棄常量與回收Java堆中的對象很是相似,沒有任何地方引用這個常量,當發生內存回收時,有必要的話,就會將這個常量清理出常量池。

回收無用的類:

  • 該類全部的實例都已經被回收,也就是Java堆中不存在該類的任何實例。
  • 加載該類的ClassLoader已經被回收。
  • 該類對應的java.lang.Class對象沒有在任何地方被引用,沒法在任何地方經過反射訪問該類的方法。

垃圾收集算法

標記-清除算法

最基礎的收集算法。算法分爲「標記」和「清除」兩個階段:首先標記出全部須要回收的對象,在標記完成後統一回收全部被標記的對象。

主要不足:

  • 效率問題,標記和清除兩個過程的效率都不高;
  • 空間問題,標記清除後會產生大量不連續的內存碎片,空間碎片太多可能會致使之後在程序運行過程當中須要分配較大對象時,沒法找到足夠的連續內存而不得不提早觸發另外一次垃圾收集動做。

複製算法

將可用內存按容量分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活着的對象複製到另外一塊上面,而後再把已使用過的內存空間一次清理掉。這樣使得每次都是對整個半區進行內存回收,內存分配時也就不用考慮內存碎片等複雜狀況,只要移動堆頂指針,按順序分配內存便可,實現簡單,運行高效。

缺點:內存縮小爲原來的一半。

如今的商業虛擬機都採用這種收集算法來回收新生代,新生代中的對象98%是「朝生夕死」的,因此並不須要1:1的比例來劃份內存空間,而是將內存分爲一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。當回收時,將Eden和Survivor中還存活着的對象一次性的複製到另一塊Survivor空間上,最後清理掉Eden和剛纔用過的Survivor空間。

HotSpot虛擬機默認Eden和Survivor的大小比例是8:1,也就是每次新生代中可用內存空間爲整個新生代容量的90%(80%+10%),只有10%的內存會被浪費。固然98%的對象可回收只是通常場景下的數據,咱們沒有辦法保證每次回收都只有很少於10%的對象存活,當Survivor空間不夠用時,須要依賴其餘內存(這裏指老年代)進行分配擔保。

若是另外一塊Survivor空間沒有足夠空間存放上一次新生代收集下來的存活對象時,這些對象將直接經過分配擔保機制進入老年代。

標記-整理算法

標記整理算法標記過程與標記清理算法同樣,但後續步驟不是直接對可回收對象進行清理,而是讓全部的對象都向一端移動,而後直接清理掉端邊界之外的內存。

分代收集算法

當前商業虛擬機的垃圾收集都採用「分代收集」算法,這種算法並無什麼新的思想,只是根據對象存活週期的不一樣將內存劃分爲幾塊。通常是把Java堆分爲新生代和老年代,這樣就能夠根據各個年代的特色採用最適當的收集算法。

在新生代中,每次垃圾收集時都發現有大批對象死去,只有少許存貨,那就選用複製算法,只須要付出少許存貨對象的複製成本就能夠完成收集。而老年代中由於對象的存活率高、沒有額外空間對它進行分配擔保,就必須使用「標記-清理」或者「標記-整理」算法來進行回收。

相關文章
相關標籤/搜索