哪些內存須要回收?java
哪些內存須要回收是垃圾回收機制第一個要考慮的問題,所謂「要回收的垃圾」無非就是那些不可能再被任何途徑使用的對象。那麼如何找到這些對象?算法
一、引用計數法緩存
這個算法的實現是,給對象中添加一個引用計數器,每當一個地方引用這個對象時,計數器值+1;當引用失效時,計數器值-1。任什麼時候刻計數值爲0的對象就是不可能再被使用的。這種算法使用場景不少,可是,Java中卻沒有使用這種算法,由於這種算法很難解決對象之間相互引用的狀況。看一段代碼:多線程
1 /** 2 * 虛擬機參數:-verbose:gc 3 */ 4 public class ReferenceCountingGC 5 { 6 private Object instance = null; 7 private static final int _1MB = 1024 * 1024; 8 9 /** 這個成員屬性惟一的做用就是佔用一點內存 */ 10 private byte[] bigSize = new byte[2 * _1MB]; 11 12 public static void main(String[] args) 13 { 14 ReferenceCountingGC objectA = new ReferenceCountingGC(); 15 ReferenceCountingGC objectB = new ReferenceCountingGC(); 16 objectA.instance = objectB; 17 objectB.instance = objectA; 18 objectA = null; 19 objectB = null; 20 21 System.gc(); 22 } 23 }
看下運行結果:併發
[GC 4417K->288K(61440K), 0.0013498 secs] [Full GC 288K->194K(61440K), 0.0094790 secs]
看到,兩個對象相互引用着,可是虛擬機仍是把這兩個對象回收掉了,這也說明虛擬機並非經過引用計數法來斷定對象是否存活的。框架
二、可達性分析法佈局
這個算法的基本思想是經過一系列稱爲「GC Roots」的對象做爲起始點,從這些節點向下搜索,搜索所走過的路徑稱爲引用鏈,當一個對象到GC Roots沒有任何引用鏈(即GC Roots到對象不可達)時,則證實此對象是不可用的。在Java語言中能夠做爲GC Roots的對象包括:性能
· 虛擬機棧中引用的對象優化
· 方法區中靜態屬性引用的對象網站
· 方法區中常量引用的對象
· 本地方法棧中JNI(即Native方法)引用的對象
4種引用狀態
在JDK1.2以前,Java中引用的定義很傳統:若是引用類型的數據中存儲的數值表明的是另外一塊內存的起始地址,就稱這塊內存表明着一個引用。這種定義很純粹,可是太過於狹隘,一個對象只有被引用或者沒被引用兩種狀態。咱們但願描述這樣一類對象:當內存空間還足夠時,則能保留在內存中;若是內存空間在進行垃圾收集後仍是很是緊張,則能夠拋棄這些對象。不少系統的緩存功能都符合這樣的應用場景。在JDK1.2以後,Java對引用的概念進行了擴充,將引用分爲強引用、軟引用、弱引用、虛引用4種,這4種引用強度依次減弱。
一、強引用
代碼中廣泛存在的相似"Object obj = new Object()"這類的引用,只要強引用還存在,垃圾收集器永遠不會回收掉被引用的對象
二、軟引用
描述有些還有用但並不是必需的對象。在系統將要發生內存溢出異常以前,將會把這些對象列進回收範圍進行二次回收。若是此次回收尚未足夠的內存,纔會拋出內存溢出異常。Java中的類SoftReference表示軟引用
三、弱引用
描述非必需對象。被弱引用關聯的對象只能生存到下一次垃圾回收以前,垃圾收集器工做以後,不管當前內存是否足夠,都會回收掉只被弱引用關聯的對象。Java中的類WeakReference表示弱引用
四、虛引用
這個引用存在的惟一目的就是在這個對象被收集器回收時收到一個系統通知,被虛引用關聯的對象,和其生存時間徹底不要緊。Java中的類PhantomReference表示虛引用
方法區回收
虛擬機規範中不要求方法區必定要實現垃圾回收,並且方法區中進行垃圾回收的效率也確實比較低,可是HotSpot對方法區也是進行回收的,主要回收的是廢棄常量和無用的類兩部分。判斷一個常量是否「廢棄常量」比較簡單,只要當前系統中沒有任何一處引用該常量就行了,可是要斷定一個類是否「無用的類」條件就要苛刻不少,類須要同時知足如下三個條件:
一、該類全部實例都已經被回收,也就是說Java堆中不存在該類的任何實例
二、加載該類的ClassLoader已經被回收
三、該類對應的java.lang.Class對象沒有在任何地方被引用,沒法在任何地方經過反射訪問該類的方法
在大量使用反射、動態代理、CGLib等ByteCode框架、動態生成JSP以及OSGi這類頻繁自定義ClassLoader的場景都須要虛擬機具有類卸載功能,以保證方法區不會溢出。
垃圾回收算法
第一步考量了哪些對象進行回收後,第二步天然是如何對對象進行回收了。這裏主要寫幾種垃圾回收算法的思想。
一、標記-清除(Mark-Sweep)算法
這是最基礎的算法,標記-清除算法就如同它的名字樣,分爲「標記」和「清除」兩個階段:首先標記出全部須要回收的對象,標記完成後統一回收全部被標記的對象。這種算法的不足主要體如今效率和空間,從效率的角度講,標記和清除兩個過程的效率都不高;從空間的角度講,標記清除後會產生大量不連續的內存碎片, 內存碎片太多可能會致使之後程序運行過程當中在須要分配較大對象時,沒法找到足夠的連續內存而不得不提早觸發一次垃圾收集動做。標記-清除算法執行過程如圖:
二、複製(Copying)算法
複製算法是爲了解決效率問題而出現的,它將可用的內存分爲兩塊,每次只用其中一塊,當這一塊內存用完了,就將還存活着的對象複製到另一塊上面,而後再把已經使用過的內存空間一次性清理掉。這樣每次只須要對整個半區進行內存回收,內存分配時也不須要考慮內存碎片等複雜狀況,只須要移動指針,按照順序分配便可。複製算法的執行過程如圖:
不過這種算法有個缺點,內存縮小爲了原來的一半,這樣代價過高了。如今的商用虛擬機都採用這種算法來回收新生代,不過研究代表1:1的比例很是不科學,所以新生代的內存被劃分爲一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。每次回收時,將Eden和Survivor中還存活着的對象一次性複製到另一塊Survivor空間上,最後清理掉Eden和剛纔用過的Survivor空間。HotSpot虛擬機默認Eden區和Survivor區的比例爲8:1,意思是每次新生代中可用內存空間爲整個新生代容量的90%。固然,咱們沒有辦法保證每次回收都只有很少於10%的對象存活,當Survivor空間不夠用時,須要依賴老年代進行分配擔保(Handle Promotion)。
三、標記-整理(Mark-Compact)算法
複製算法在對象存活率較高的場景下要進行大量的複製操做,效率很低。萬一對象100%存活,那麼須要有額外的空間進行分配擔保。老年代都是不易被回收的對象,對象存活率高,所以通常不能直接選用複製算法。根據老年代的特色,有人提出了另一種標記-整理算法,過程與標記-清除算法同樣,不過不是直接對可回收對象進行清理,而是讓全部存活對象都向一端移動,而後直接清理掉邊界之外的內存。標記-整理算法的工做過程如圖:
分代收集
根據上面的內容,用一張圖歸納一下堆內存的佈局
現代商用虛擬機基本都採用分代收集算法來進行垃圾回收。這種算法沒什麼特別的,無非是上面內容的結合罷了,根據對象的生命週期的不一樣將內存劃分爲幾塊,而後根據各塊的特色採用最適當的收集算法。大批對象死去、少許對象存活的,使用複製算法,複製成本低;對象存活率高、沒有額外空間進行分配擔保的,採用標記-清理算法或者標記-整理算法。
垃圾收集器
垃圾收集器就是上面講的理論知識的具體實現了。不一樣虛擬機所提供的垃圾收集器可能會有很大差異,咱們使用的是HotSpot,HotSpot這個虛擬機所包含的全部收集器如圖:
上圖展現了7種做用於不一樣分代的收集器,若是兩個收集器之間存在連線,那說明它們能夠搭配使用。虛擬機所處的區域說明它是屬於新生代收集器仍是老年代收集器。多說一句,咱們必需要明白一個道理:沒有最好的垃圾收集器,更加沒有萬能的收集器,只能選擇對具體應用最合適的收集器。這也是HotSpot爲何要實現這麼多收集器的緣由。OK,下面一個一個看一下收集器:
一、Serial收集器
最基本、發展歷史最久的收集器,這個收集器是一個採用複製算法的單線程的收集器,單線程一方面意味着它只會使用一個CPU或一條線程去完成垃圾收集工做,另外一方面也意味着它進行垃圾收集時必須暫停其餘線程的全部工做,直到它收集結束爲止。後者意味着,在用戶不可見的狀況下要把用戶正常工做的線程所有停掉,這對不少應用是難以接受的。不過實際上到目前爲止,Serial收集器依然是虛擬機運行在Client模式下的默認新生代收集器,由於它簡單而高效。用戶桌面應用場景中,分配給虛擬機管理的內存通常來講不會很大,收集幾十兆甚至一兩百兆的新生代停頓時間在幾十毫秒最多一百毫秒,只要不是頻繁發生,這點停頓是徹底能夠接受的。
二、ParNew收集器
ParNew收集器其實就是Serial收集器的多線程版本,除了使用多條線程進行垃圾收集外,其他行爲和Serial收集器徹底同樣,包括使用的也是複製算法。ParNew收集器除了多線程之外和Serial收集器並無太多創新的地方,可是它倒是Server模式下的虛擬機首選的新生代收集器,其中有一個很重要的和性能無關的緣由是,除了Serial收集器外,目前只有它能與CMS收集器配合工做(看圖)。CMS收集器是一款幾乎能夠認爲有劃時代意義的垃圾收集器,由於它第一次實現了讓垃圾收集線程與用戶線程基本上同時工做。ParNew收集器在單CPU的環境中絕對不會有比Serial收集器更好的效果,甚至因爲線程交互的開銷,該收集器在兩個CPU的環境中都不能百分之百保證能夠超越Serial收集器。固然,隨着可用CPU數量的增長,它對於GC時系統資源的有效利用仍是頗有好處的。它默認開啓的收集線程數與CPU數量相同,在CPU數量很是多的狀況下,可使用-XX:ParallelGCThreads參數來限制垃圾收集的線程數。
三、Parallel收集器
Parallel收集器也是一個新生代收集器,也是用複製算法的收集器,也是並行的多線程收集器,可是它的特色是它的關注點和其餘收集器不一樣。介紹這個收集器主要仍是介紹吞吐量的概念。CMS等收集器的關注點是儘量縮短垃圾收集時用戶線程的停頓時間,而Parallel收集器的目標則是打到一個可控制的吞吐量。所謂吞吐量的意思就是CPU用於運行用戶代碼時間與CPU總消耗時間的比值,即吞吐量=運行用戶代碼時間/(運行用戶代碼時間+垃圾收集時間),虛擬機總運行100分鐘,垃圾收集1分鐘,那吞吐量就是99%。另外,Parallel收集器是虛擬機運行在Server模式下的默認垃圾收集器。
停頓時間短適合須要與用戶交互的程序,良好的響應速度能提高用戶體驗;高吞吐量則能夠高效率利用CPU時間,儘快完成運算任務,主要適合在後臺運算而不須要太多交互的任務。
虛擬機提供了-XX:MaxGCPauseMillis和-XX:GCTimeRatio兩個參數來精確控制最大垃圾收集停頓時間和吞吐量大小。不過不要覺得前者越小越好,GC停頓時間的縮短是以犧牲吞吐量和新生代空間換取的。因爲與吞吐量關係密切,Parallel收集器也被稱爲「吞吐量優先收集器」。Parallel收集器有一個-XX:+UseAdaptiveSizePolicy參數,這是一個開關參數,這個參數打開以後,就不須要手動指定新生代大小、Eden區和Survivor參數等細節參數了,虛擬機會根據當親系統的運行狀況手機性能監控信息,動態調整這些參數以提供最合適的停頓時間或者最大的吞吐量。若是對於垃圾收集器運做原理不太瞭解,以致於在優化比較困難的時候,使用Parallel收集器配合自適應調節策略,把內存管理的調優任務交給虛擬機去完成將是一個不錯的選擇。
四、Serial Old收集器
Serial收集器的老年代版本,一樣是一個單線程收集器,使用「標記-整理算法」,這個收集器的主要意義也是在於給Client模式下的虛擬機使用。
五、Parallel Old收集器
Parallel收集器的老年代版本,使用多線程和「標記-整理」算法。這個收集器在JDK 1.6以後的出現,「吞吐量優先收集器」終於有了比較名副其實的應用組合,在注重吞吐量以及CPU資源敏感的場合,均可以優先考慮Parallel收集器+Parallel Old收集器的組合。
六、CMS收集器
CMS收集器是一種以獲取最短回收停頓時間爲目標的老年代收集器。目前很大一部分Java應用集中在互聯網站或者B/S系統的服務端上,這類應用尤爲注重服務的響應速度,但願系統停頓時間最短,以給用戶帶來較好的體驗,CMS收集器就很是符合這類應用的需求。CMS收集器從名字就能看出是基於「標記-清除」算法實現的。
七、G1收集器
G1(Garbage-First)收集器是當今收集器技術發展的最前沿成果之一,JDK 7 Update 4後開始進入商用。在G1收集器以前的其餘收集器進行收集的範圍都是整個新生代或者老年代,而G1收集器再也不是這樣,使用G1收集器時,Java堆的內存佈局就與其餘收集器有很大差異,它將整個Java堆分爲多個大小相等的獨立區域(Region),雖然還保留有新生代和老年代的概念,但新生代和老年代再也不是物理隔離的了,它們都是一部分Region的集合。G1收集器跟蹤各個Region裏面的垃圾堆積的價值大小,在後臺維護一個優先列表,每次根據容許的收集時間,優先回收價值最大的Region(這也是Garbage-First名稱的由來)。這種使用Region劃份內存空間以及有優先級的區域回收方式,保證了G1收集器在有限的時間內能夠獲取儘量高的收集效率。
垃圾收集器總結
來看一下對垃圾收集器的總結,列了一張表
GC組合 |
Minor GC |
Full GC |
描述 |
-XX:+UseSerialGC | Serial收集器串行回收 | Serial Old收集器串行回收 | 該選項能夠手動指定Serial收集器+Serial Old收集器組合執行內存回收 |
-XX:+UseParNewGC | ParNew收集器並行回收 | Serial Old收集器串行回收 | 該選項能夠手動指定ParNew收集器+Serilal Old組合執行內存回收 |
-XX:+UseParallelGC | Parallel收集器並行回收 | Serial Old收集器串行回收 | 該選項能夠手動指定Parallel收集器+Serial Old收集器組合執行內存回收 |
-XX:+UseParallelOldGC | Parallel收集器並行回收 | Parallel Old收集器並行回收 | 該選項能夠手動指定Parallel收集器+Parallel Old收集器組合執行內存回收 |
-XX:+UseConcMarkSweepGC | ParNew收集器並行回收 | 缺省使用CMS收集器併發回收,備用採用Serial Old收集器串行回收 |
該選項能夠手動指定ParNew收集器+CMS收集器+Serial Old收集器組合執行內存回收。優先使用ParNew收集器+CMS收集器的組合,當出現ConcurrentMode Fail或者Promotion Failed時,則採用ParNew收集器+Serial Old收集器的組合 |
-XX:+UseConcMarkSweepGC -XX:-UseParNewGC |
Serial收集器串行回收 | ||
-XX:+UseG1GC | G1收集器併發、並行執行內存回收 | 暫無 |
GC日誌
每種收集器的日誌形式都是由它們自身的實現所決定的,換言之,每種收集器的日誌格式均可以不同。不過虛擬機爲了方便用戶閱讀,將各個收集器的日誌都維持了必定的共性,就以最前面的對象間相互引用的那個類ReferenceCountingGC的代碼爲例:
虛擬機參數爲「-XX:+PrintGCDetails -XX:+UseSerialGC」,使用Serial+Serial Old組合進行垃圾回收的日誌
[GC [DefNew: 310K->194K(2368K), 0.0269163 secs] 310K->194K(7680K), 0.0269513 secs] [Times: user=0.00 sys=0.00, real=0.03 secs] [GC [DefNew: 2242K->0K(2368K), 0.0018814 secs] 2242K->2241K(7680K), 0.0019172 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System) [Tenured: 2241K->193K(5312K), 0.0056517 secs] 4289K->193K(7680K), [Perm : 2950K->2950K(21248K)], 0.0057094 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] Heap def new generation total 2432K, used 43K [0x00000000052a0000, 0x0000000005540000, 0x0000000006ea0000) eden space 2176K, 2% used [0x00000000052a0000, 0x00000000052aaeb8, 0x00000000054c0000) from space 256K, 0% used [0x00000000054c0000, 0x00000000054c0000, 0x0000000005500000) to space 256K, 0% used [0x0000000005500000, 0x0000000005500000, 0x0000000005540000) tenured generation total 5312K, used 193K [0x0000000006ea0000, 0x00000000073d0000, 0x000000000a6a0000) the space 5312K, 3% used [0x0000000006ea0000, 0x0000000006ed0730, 0x0000000006ed0800, 0x00000000073d0000) compacting perm gen total 21248K, used 2982K [0x000000000a6a0000, 0x000000000bb60000, 0x000000000faa0000) the space 21248K, 14% used [0x000000000a6a0000, 0x000000000a989980, 0x000000000a989a00, 0x000000000bb60000) No shared spaces configured.
虛擬機參數爲「-XX:+PrintGCDetails -XX:+UseParNewGC」,使用ParNew+Serial Old組合進行垃圾回收的日誌
[GC [ParNew: 310K->205K(2368K), 0.0006664 secs] 310K->205K(7680K), 0.0007043 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [GC [ParNew: 2253K->31K(2368K), 0.0032525 secs] 2253K->2295K(7680K), 0.0032911 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System) [Tenured: 2264K->194K(5312K), 0.0054415 secs] 4343K->194K(7680K), [Perm : 2950K->2950K(21248K)], 0.0055105 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] Heap par new generation total 2432K, used 43K [0x0000000005550000, 0x00000000057f0000, 0x0000000007150000) eden space 2176K, 2% used [0x0000000005550000, 0x000000000555aeb8, 0x0000000005770000) from space 256K, 0% used [0x0000000005770000, 0x0000000005770000, 0x00000000057b0000) to space 256K, 0% used [0x00000000057b0000, 0x00000000057b0000, 0x00000000057f0000) tenured generation total 5312K, used 194K [0x0000000007150000, 0x0000000007680000, 0x000000000a950000) the space 5312K, 3% used [0x0000000007150000, 0x0000000007180940, 0x0000000007180a00, 0x0000000007680000) compacting perm gen total 21248K, used 2982K [0x000000000a950000, 0x000000000be10000, 0x000000000fd50000) the space 21248K, 14% used [0x000000000a950000, 0x000000000ac39980, 0x000000000ac39a00, 0x000000000be10000) No shared spaces configured.
虛擬機參數爲「-XX:+PrintGCDetails -XX:+UseParallelGC」,使用Parallel+Serial Old組合進行垃圾回收的日誌
[GC [PSYoungGen: 4417K->288K(18688K)] 4417K->288K(61440K), 0.0007910 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] [Full GC (System) [PSYoungGen: 288K->0K(18688K)] [PSOldGen: 0K->194K(42752K)] 288K->194K(61440K) [PSPermGen: 2941K->2941K(21248K)], 0.0032663 secs] [Times: user=0.02 sys=0.00, real=0.00 secs] Heap PSYoungGen total 18688K, used 321K [0x0000000034190000, 0x0000000035660000, 0x0000000048f90000) eden space 16064K, 2% used [0x0000000034190000,0x00000000341e05c0,0x0000000035140000) from space 2624K, 0% used [0x0000000035140000,0x0000000035140000,0x00000000353d0000) to space 2624K, 0% used [0x00000000353d0000,0x00000000353d0000,0x0000000035660000) PSOldGen total 42752K, used 194K [0x000000000a590000, 0x000000000cf50000, 0x0000000034190000) object space 42752K, 0% used [0x000000000a590000,0x000000000a5c0810,0x000000000cf50000) PSPermGen total 21248K, used 2982K [0x0000000005190000, 0x0000000006650000, 0x000000000a590000) object space 21248K, 14% used [0x0000000005190000,0x0000000005479980,0x0000000006650000)
虛擬機參數爲「-XX:+PrintGCDetails -XX:+UseConcMarkSweepGC」,使用ParNew+CMS+Serial Old組合進行垃圾回收的日誌
[Full GC (System) [CMS: 0K->194K(62656K), 0.0080796 secs] 4436K->194K(81792K), [CMS Perm : 2941K->2940K(21248K)], 0.0081589 secs] [Times: user=0.01 sys=0.00, real=0.01 secs] Heap par new generation total 19136K, used 340K [0x0000000005540000, 0x0000000006a00000, 0x0000000006a00000) eden space 17024K, 2% used [0x0000000005540000, 0x0000000005595290, 0x00000000065e0000) from space 2112K, 0% used [0x00000000065e0000, 0x00000000065e0000, 0x00000000067f0000) to space 2112K, 0% used [0x00000000067f0000, 0x00000000067f0000, 0x0000000006a00000) concurrent mark-sweep generation total 62656K, used 194K [0x0000000006a00000, 0x000000000a730000, 0x000000000a940000) concurrent-mark-sweep perm gen total 21248K, used 2981K [0x000000000a940000, 0x000000000be00000, 0x000000000fd40000)
這四段GC日誌中提煉出一些共性:
觸發GC的時機
最後總結一下何時會觸發一次GC,我的經驗看,有三種場景會觸發GC: