Java 堆中存放着幾乎全部的對象實例,垃圾收集器在對堆進行回收前,須要肯定對象是否存活。java
給對象添加一個引用計數器,每當一個地方引用它時,計數器的值加 1;引用失效時減 1。算法
主流 JVM 沒有選用此種算法管理內存,主要緣由是它難以解決對象間循環引用的問題。數組
可達性分析算法是 JVM 主流實現中採用的算法。基本思路是經過一系列 GC Roots
對象爲起點向下搜索,搜索所走過的路徑稱爲 引用鏈
。當一個對象到 GC Roots 沒有任何引用鏈相連時,會被斷定爲可回收對象。安全
GC Roots 對象包括如下幾種:虛擬機棧中引用的對象;方法區中類靜態屬性引用的對象;方法區中常量引用的對象;本地方法棧中引用的對象。多線程
JDK 1.2 後,Java 中的引用分爲強引用、軟引用、弱引用和虛引用 4 種。併發
強引用在代碼中廣泛存在,如 Object o = new Object()
,只要強引用在,垃圾回收器就永遠不會回收被引用的對象。線程
軟引用用來描述有用但非必須的對象,在發生內存溢出異常以前被回收。code
弱引用和軟引用相似,強度更弱,只能生存到下一次垃圾收集以前。對象
虛引用不會對生存時間構成影響,也沒法經過虛引用取得實例,設置虛引用的惟一目的就是能在這個對象被回收時受到系統通知。blog
方法區的回收主要包括廢棄常量和無用的類。
廢棄常量和堆中的對象相似,當發生垃圾回收時,若是常量池中的常量不存在任何引用,必要狀況下回被清理。
判斷一個類無用的條件很苛刻,須要全部實例都已經被回收、加載該類的 ClassLoader 已經被回收,而且該類對應的 java.lang.Class 對象沒有在任何地方被引用,沒法經過反射訪問該類的方法,知足以上條件的無用類才能被回收。
先標記出全部須要回收的對象,而後統一回收。兩個階段效率都不高,另外標記清除後會產生大量不連續的內存碎片。
將可用內存分爲大小相等兩塊,每次使用其中一塊。內存用完時將還存活的對象複製到另外一塊上,再把已使用的空間一次清理掉。
新生代中大多對象朝生夕死,不須要按照 1 : 1 分配內存空間,而是分爲一塊較大的 Eden 空間和兩塊較小的 Survivor 空間,每次使用 Eden 空間和其中一塊 Survivor 空間。回收時將 Eden 和 Survivor 中存活的對象一次性複製到另外一塊 Survivor 空間,再清理掉以前使用的兩塊內存空間。HotSpot 默認 Eden 和 Survivor 的大小比例爲 8 : 1,可用空間爲 90%。當 Survivor 內存不夠時需依賴老年代進行分配擔保。
標記整理算法更適合於老年代,標記以後不直接對可回收對象進行清理,而是讓存活對象都向一段移動,而後清理掉邊界之外的內存。
當前商業虛擬機都採用分代收集,根據對象存活週期把內存劃分爲幾塊。通常把 Java 堆分爲新生代和老年代,新生代採用複製算法,老年代使用標記清理算法或標記整理算法。
HotSpot 實現上述算法時,須對算法的執行效率嚴格考量,才能保證虛擬機高效運行。
主流虛擬機都使用 準確式 GC
,即知道內存中數據的具體類型,因此不須要一個不漏地檢查全部執行上下文和全局的引用位置。JVM 有辦法直接得知哪些地方存放着對象引用,HotSpot 使用一組稱爲 OopMap
的數據類型達到這個目的。
致使 OopMap 變化的指令不少,若是針對每次變化採起措施 GC 的成本會變得很高。實際上,HotSpot 沒有爲每條指令生成 OopMap,只在特定位置記錄這些信息,這些位置稱爲 安全點
,程序只有在安全點才能暫停。安全點既不能太少又不能太多,基本選在方法調用、循環跳轉等具備讓程序長時間執行特性的位置。
讓程序在安全點暫停主要有 搶先式中斷 和 主動式中斷 兩種方案。搶先式先把全部線程中斷,再讓不處於安全點的線程繼續執行到安全點。主動式則是在安全點的位置有是否須要中斷的標誌,線程執行到安全點時依據標誌中斷掛起。
安全區域指在一段代碼片斷內不會引發引用變化的區域,如線程處於 Sleep 狀態揮着 Blocked 狀態,線程沒法響應 JVM 的中斷請求。
程序進入安全區域時,先標記本身已經進入安全區域,如在這個時候發起 GC,不須要處理標記進去安全區域的線程。在線程離開安全區域時,須要檢查是否完成枚舉根節點或整個 GC 過程,已完成則繼續執行,不然須要等到接收能夠安全離開的信號爲止。
垃圾收集器是內存回收的具體實現,目前沒有最好的收集器,只有最合適的收集器,因此 JVM 實現了幾個不一樣的收集器。
單線程收集器,只使用一個 CPU 和一個收集線程,垃圾回收時暫停其餘全部的工做線程,直到收集結束。
與其餘收集器的單線程比簡單高效,對於運行在 Client 模式下的虛擬機是一個好選擇。
新生代採用複製算法,老年代採用標記整理算法。
Serial 的多線程版本,能與 CMS 收集器配置工做,因此是許多運行在 Server 模式下的首選新生代收集器。
在垃圾收集器的上下文中,先明確兩個概念:
並行:多條垃圾線程並行工做,用戶線程仍然處於等待狀態
併發:用戶線程和垃圾回收線程同時執行(不必定並行,可能會交替執行)
使用複製算法的新生代多線程收集器,特色是更關注吞吐量,即運行用戶代碼時間 / (運行用戶代碼時間 + 垃圾收集時間)。
Parallel Scavenge 收集有一個參數開關 -XX:+UseAdaptiveSizePolicy,打開後就不須要手動設置新生代大小、Eden 與 Survivor 區的比例等細節參數,JVM 會根據當前系統運行狀況動態調整,以提供最合適的停頓時間或最大吞吐量。
Concurrent Mark Sweep 以獲取最短收回停頓時間爲目標,使用標記清除算法。收集過程分爲 4 部:初始標記、併發標記、從新標記和併發清理。初始標記和從新標記耗時不多,併發標記和併發清理兩部耗時較長,但均可以與用戶線程一塊兒併發執行。
CMS 收集器有 3 個明顯缺點:1.對 CPU 資源敏感,併發階段佔用一部分 CPU 資源致使應用程序變慢。2.沒法收集浮動垃圾,即併發清理階段因爲程序還在運行產生的垃圾,可能致使另外一次 Full GC。3.標記清除算法致使收集結束後存在大量空間碎片,可配置 Full GC 執行多少次時伴隨一次空間壓縮。
Garbge-First 面向服務端應用,具備併發並行、分代收集、空間整合、可預測停頓等特色。
使用 G1 時,Java 堆的內存分爲多個大小相等的獨立區域,雖然保留新生代和老年代的概念,但再也不是屋裏隔離。G1 跟蹤各個 Region 裏垃圾堆積的價值,在後臺維護一個優先列表,優先回收價值最大的 Region。
G1 的運做大體分爲初始標記、併發標記、最終標記和篩選回收。
多數狀況下,對象在新生代 Eden 區分配。Eden 沒有足夠的空間時進行一次 Minor GC。當存活對象沒法放入 Survivor 區時,經過分配擔保提早轉移到老年代。
須要大量連續內存空間的大對象會直接進入老年代,如很長的字符串或數組。常常出現大對象容易致使內存還有很多空間時就今天出發 GC。
長期存活的對象進入老年代。每通過一次 Minor GC,對象中的年齡計數器會加 1,加到必定程度(默認 15)時晉升到老年代。若是 Survivor 空間中相同年齡的全部對象帶下總和大於 Survivor 空間的一半,年齡大於或等於該年齡的對象能夠直接進入老年代。
在發生 Minor GC 以前,JVM 會先檢查老年代中最大可用連續空間是否大於新生代全部對象總和,若是大於,Minor GC 能夠肯定是安全的。不然要根據是否容許擔保失敗判斷是否進行 Full GC。容許擔保失敗時,會根據以前晉升老年代的平均大小做爲經驗來斷定是否進行嘗試。