Java虛擬機 —— 垃圾回收機制

在Java虛擬機中,對象和數組的內存都是在堆中分配的,垃圾收集器主要回收的內存就是再堆內存中。若是在Java程序運行過程當中,動態建立的對象或者數組沒有及時獲得回收,持續積累,最終堆內存就會被佔滿,致使OOM。算法

JVM提供了一種垃圾回收機制,簡稱GC機制。經過GC機制,可以在運行過程當中將堆中的垃圾對象不斷回收,從而保證程序的正常運行。數組

垃圾對象的斷定

咱們都知道,所謂「垃圾」對象,就是指咱們在程序的運行過程當中再也不有用的對象,即再也不存活的對象。那麼怎麼來判斷堆中的對象是「垃圾」、再也不存活的對象呢?.net

引用計數法

每一個對象都有一個引用計數的屬性,用來保存該對象被引用的次數。當引用次數爲0時,就意味着該對象沒有被引用了,也就不會在使用這個對象了,能夠斷定爲垃圾對象。可是,這種方式有一個很大的Bug,就是沒法解決對象間相互引用或者循環引用的問題:當兩個對象相互引用,他們兩個和其餘任何對象也沒有引用關係,它倆的引用次數都不爲0,所以不會被回收,但實際上這兩個對象已經再也不有用了。線程

可達性分析(根搜索法)

爲了不使用引用計數法帶來的問題,Java採用了可達性分析法來判斷垃圾對象。3d

這種方式能夠將全部對象的引用關係想象成一棵樹,從樹的根節點GC Root遍歷全部引用的對象,樹的節點就爲可達對象,其餘沒有處於節點的對象則爲不可達對象。
日誌


那麼什麼樣的對象能夠做爲GC的根節點呢?

  • 虛擬機棧(幀棧中的本地變量表)中引用的對象
  • 方法區中靜態屬性引用的對象
  • 方法區中常量引用的對象
  • 本地方法棧中JNI引用的對象

引用狀態

垃圾回收機制,無論採用是引用計數法,仍是可達性分析法,都與對象的引用有關,Java中存在四種引用狀態:code

  • 強引用 - 咱們使用的大部分引用實際上都是強引用,這是使用最廣泛的引用。若是一個對象具備強引用,就表示它處於可達狀態,垃圾回收器毫不會回收它,即使系統內存很是緊張,Java虛擬機寧願拋出OutOfMemoryError錯誤,使程序異常終止,也不會回收被強引用所引用的對象。所以,強引用是形成Java內存泄露的主要緣由之一。cdn

  • 軟引用 - 一個對象只具備軟引用,若是內存空間足夠,垃圾回收器就不會回收它,若是內存空間不足了,就會回收這些對象的內存。只要垃圾回收器沒有回收它,該對象就能夠被程序使用。對象

  • 弱引用 - 一個對象只具備弱引用,那就相似因而無關緊要的。弱引用和軟引用很像,但弱引用的引用級別更低。弱引用與軟引用的區別在於:只具備弱引用的對象擁有更短暫的生命週期。在垃圾回收器線程掃描它所管轄的內存區域的過程當中,一旦發現了只具備弱引用的對象,無論當前內存空間足夠與否,都會回收它的內存。blog

  • 虛引用 - 一個對象僅持有虛引用,那麼它就和沒有任何引用同樣,在任什麼時候候均可能被垃圾回收器回收。虛引用主要用來跟蹤對象被垃圾回收的活動,咱們日常通常不會使用。

垃圾回收算法

經過可達性分析算法可以斷定哪些對象是須要回收的了,那麼回收具體須要怎樣去執行呢?

標記-清除算法

首先須要標記能夠回收的對象內存,而後在對回收的內存進行清除。

標記-清除算法(回收前)
標記-清除算法(回收前)

標記-清除算法(回收後)
標記-清除算法(回收後)

可是這樣的話,隨着程序的運行,會不斷分配釋放內存,在堆中會產生不少的不連續的空閒內存區,即內存碎片。這樣即便有足夠多的空閒內存,也不必定能分配出足夠大的內存,而且可能會形成頻繁的GC,影響效率,甚至OOM。

標記-整理算法

和標記-清除算法不一樣的是,標記-整理算法在標記後不直接清理可回收內存,而是將存活對象都移動到一端,而後清除掉可回收內存。

標記-整理算法(回收前)
標記-整理算法(回收前)

標記-整理算法(回收後)
標記-整理算法(回收後)

這樣作的好處就是不會產生內存碎片。

複製算法

複製算法須要先將內存分爲兩塊,先在其中一塊內存上分配內存,當這塊內存被分配完後,則執行垃圾回收,而後把存活對象所有複製到另外一塊內存上,第一塊內存則所有清空。

複製算法(回收前)
複製算法(回收前)

複製算法(回收後)
複製算法(回收後)

這種算法不會產生內存碎片,可是至關於只能使用一半的內存空間。同時,複製算法和存活對象的數量有關,若是存活對象的數量多,那麼複製算法的效率會大大下降。

分代收集算法

在Java虛擬機中,對象的生命週期有長有短,大部分對象的生命週期很短,只有少部分的對象纔會在內存中存留較長時間,所以能夠依據對象生命週期的長短將它們放在不一樣的區域。在採用分代收集算法的Java虛擬機堆中,通常分爲三個區域,用來分別儲存這三類對象:

  • 新生代 - 剛建立的對象,在代碼運行時通常都會持續不斷地建立新的對象,這些新建立的對象有不少是局部變量,很快就會變成垃圾對象。這些對象被放在一塊稱爲新生代的內存區域。新生代的特色是垃圾對象多,存活對象少。

  • 老年代 - 一些對象很早被建立了,經歷了屢次GC也沒有被回收,而是一直存活下來。這些對象被放在一塊稱爲老年代的區域。老年代的特色是存活對象多,垃圾對象少。

  • 永久代 - 一些伴隨虛擬機生命週期永久存在的對象,好比一些靜態對象,常量等。這些對象被放在一塊稱爲永久代的區域。永久代的特色是這些對象通常不須要垃圾回收,會在虛擬機運行過程當中一直存活。(在Java1.7以前,方法區中存儲的是永久代對象,Java1.7方法區的永久代對象移到了堆中,而在Java1.8永久代已經從堆中移除了,這塊內存給了元空間。)

分代收集算法也就根據新生代和老年代來進行垃圾回收的。

對於新生代區域,每次GC都會有不少垃圾對象被回收,只有少許存活。所以採用複製回收算法,GC時把剩餘不多的存活對象複製過去便可。

在新生代區域中,並非按照1:1的比例來進行復制回收,而是按照8:1:1的比例分爲了Eden、SurvivorA、SurvivorB三個區域。其中Eden意爲伊甸園,形容有不少新生對象在裏面建立;Survivor區則爲倖存者,即經歷GC後仍然存活下來的對象。

  1. Eden區對外提供堆內存。當Eden區快要滿了,則進行Minor GC(新生代GC),把存活對象放入SurvivorA區,清空Eden區;
  2. Eden區被清空後,繼續對外提供堆內存;
  3. 當Eden區再次被填滿,此時對Eden區和SurvivorA區同時進行Minor GC(新生代GC),把存活對象放入SurvivorB區,此時同時清空Eden區和SurvivorA區;
  4. Eden區繼續對外提供堆內存,並重覆上述過程,即在 Eden 區填滿後,把Eden區和某個Survivor區的存活對象放到另外一個Survivor區;
  5. 當某個Survivor區被填滿,且仍有對象未被複制完畢時,或者某些對象在反覆Survive 15次左右時,則把這部分剩餘對象放到老年代區域;當老年區也被填滿時,進行Major GC(老年代GC),對老年代區域進行垃圾回收。

老年代區域對象通常存活週期較長,每次GC時,存活的對象比較多,所以採用標記-整理算法,GC時移動少許存活對象,不會產生內存碎片。

觸發GC的類型

Java虛擬機會把每次觸發GC的信息打印出來,能夠根據日誌來分析觸發GC的緣由。

  • GC_FOR_MALLOC:表示是在堆上分配對象時內存不足觸發的GC。
  • GC_CONCURRENT:當咱們應用程序的堆內存達到必定量,或者能夠理解爲快要滿的時候,系統會自動觸發GC操做來釋放內存。
  • GC_EXPLICIT:表示是應用程序調用System.gc、VMRuntime.gc接口或者收到SIGUSR1信號時觸發的GC。
  • GC_BEFORE_OOM:表示是在準備拋OOM異常以前進行的最後努力而觸發的GC。

參考:

Java內存回收機制--Java引用的種類(強引用、弱引用、軟引用、虛引用)
理解Java垃圾回收機制
Java 技術之垃圾回收機制

相關文章
相關標籤/搜索