目錄html
Java GC(Garbage Collection,垃圾收集,垃圾回收)機制,是Java與C++/C的主要區別之一,做爲Java開發者,通常不須要專門編寫內存回收和垃圾清理代碼,對內存泄露和溢出的問題,也不須要像C程序員那樣戰戰兢兢。這是由於在Java虛擬機中,存在自動內存管理和垃圾清掃機制。歸納地說,該機制對JVM(Java Virtual Machine)中的內存進行標記,並肯定哪些內存須要回收,根據必定的回收策略,自動的回收內存,永不停息(Nerver Stop)的保證JVM中的內存空間,防止出現內存泄露和溢出問題。程序員
關於JVM,須要說明一下的是,目前使用最多的Sun公司的JDK中,自從1999年的JDK1.2開始直至如今仍在普遍使用的JDK6,其中默認的虛擬機都是HotSpot。2009年,Oracle收購Sun,加上以前收購的EBA公司,Oracle擁有3大虛擬機中的兩個:JRockit和HotSpot,Oracle也代表了想要整合兩大虛擬機的意圖,可是目前在新發布的JDK7中,默認的虛擬機仍然是HotSpot,所以本文中默認介紹的虛擬機都是HotSpot,相關機制也主要是指HotSpot的GC機制。算法
Java GC機制主要完成3件事:肯定哪些內存須要回收,肯定何時須要執行GC,如何執行GC。通過這麼長時間的發展(事實上,在Java語言出現以前,就有GC機制的存在,如Lisp語言),Java GC機制已經日臻完善,幾乎能夠自動的爲咱們作絕大多數的事情。然而,若是咱們從事較大型的應用軟件開發,曾經出現過內存優化的需求,就一定要研究Java GC機制。編程
學習Java GC機制,能夠幫助咱們在平常工做中排查各類內存溢出或泄露問題,解決性能瓶頸,達到更高的併發量,寫出更高效的程序。數組
咱們將從4個方面學習Java GC機制,1,內存是如何分配的;2,如何保證內存不被錯誤回收(即:哪些內存須要回收);3,在什麼狀況下執行GC以及執行GC的方式;4,如何監控和優化GC機制。網絡
瞭解Java GC機制,必須先清楚在JVM中內存區域的劃分。在Java運行時的數據區裏,由JVM管理的內存區域分爲下圖幾個模塊:多線程
其中:併發
1,程序計數器(Program Counter Register):程序計數器是一個比較小的內存區域,用於指示當前線程所執行的字節碼執行到了第幾行,能夠理解爲是當前線程的行號指示器。字節碼解釋器在工做時,會經過改變這個計數器的值來取下一條語句指令。
每一個程序計數器只用來記錄一個線程的行號,因此它是線程私有(一個線程就有一個程序計數器)的。
若是程序執行的是一個Java方法,則計數器記錄的是正在執行的虛擬機字節碼指令地址;若是正在執行的是一個本地(native,由C語言編寫完成)方法,則計數器的值爲Undefined,因爲程序計數器只是記錄當前指令地址,因此不存在內存溢出的狀況,所以,程序計數器也是全部JVM內存區域中惟一一個沒有定義OutOfMemoryError的區域。
2,虛擬機棧(JVM Stack):一個線程的每一個方法在執行的同時,都會建立一個棧幀(Statck Frame),棧幀中存儲的有局部變量表、操做站、動態連接、方法出口等,當方法被調用時,棧幀在JVM棧中入棧,當方法執行完成時,棧幀出棧。
局部變量表中存儲着方法的相關局部變量,包括各類基本數據類型,對象的引用,返回地址等。在局部變量表中,只有long和double類型會佔用2個局部變量空間(Slot,對於32位機器,一個Slot就是32個bit),其它都是1個Slot。須要注意的是,局部變量表是在編譯時就已經肯定好的,方法運行所須要分配的空間在棧幀中是徹底肯定的,在方法的生命週期內都不會改變。
虛擬機棧中定義了兩種異常,若是線程調用的棧深度大於虛擬機容許的最大深度,則拋出StatckOverFlowError(棧溢出);不過多數Java虛擬機都容許動態擴展虛擬機棧的大小(有少部分是固定長度的),因此線程能夠一直申請棧,直到內存不足,此時,會拋出OutOfMemoryError(內存溢出)。
每一個線程對應着一個虛擬機棧,所以虛擬機棧也是線程私有的。
3,本地方法棧(Native Method Statck):本地方法棧在做用,運行機制,異常類型等方面都與虛擬機棧相同,惟一的區別是:虛擬機棧是執行Java方法的,而本地方法棧是用來執行native方法的,在不少虛擬機中(如Sun的JDK默認的HotSpot虛擬機),會將本地方法棧與虛擬機棧放在一塊兒使用。
本地方法棧也是線程私有的。
4,堆區(Heap):堆區是理解Java GC機制最重要的區域,沒有之一。在JVM所管理的內存中,堆區是最大的一塊,堆區也是Java GC機制所管理的主要內存區域,堆區由全部線程共享,在虛擬機啓動時建立。堆區的存在是爲了存儲對象實例,原則上講,全部的對象都在堆區上分配內存(不過現代技術裏,也不是這麼絕對的,也有棧上直接分配的)。
通常的,根據Java虛擬機規範規定,堆內存須要在邏輯上是連續的(在物理上不須要),在實現時,能夠是固定大小的,也能夠是可擴展的,目前主流的虛擬機都是可擴展的。若是在執行垃圾回收以後,仍沒有足夠的內存分配,也不能再擴展,將會拋出OutOfMemoryError:Java heap space異常。
關於堆區的內容還有不少,將在下節「Java內存分配機制」中詳細介紹。
5,方法區(Method Area):在Java虛擬機規範中,將方法區做爲堆的一個邏輯部分來對待,但事實上,方法區並非堆(Non-Heap);另外,很多人的博客中,將Java GC的分代收集機制分爲3個代:青年代,老年代,永久代,這些做者將方法區定義爲「永久代」,這是由於,對於以前的HotSpot Java虛擬機的實現方式中,將分代收集的思想擴展到了方法區,並將方法區設計成了永久代。不過,除HotSpot以外的多數虛擬機,並不將方法區當作永久代,HotSpot自己,也計劃取消永久代。本文中,因爲筆者主要使用Oracle JDK6.0,所以仍將使用永久代一詞。
方法區是各個線程共享的區域,用於存儲已經被虛擬機加載的類信息(即加載類時須要加載的信息,包括版本、field、方法、接口等信息)、final常量、靜態變量、編譯器即時編譯的代碼等。
方法區在物理上也不須要是連續的,能夠選擇固定大小或可擴展大小,而且方法區比堆還多了一個限制:能夠選擇是否執行垃圾收集。通常的,方法區上執行的垃圾收集是不多的,這也是方法區被稱爲永久代的緣由之一(HotSpot),但這也不表明着在方法區上徹底沒有垃圾收集,其上的垃圾收集主要是針對常量池的內存回收和對已加載類的卸載。
在方法區上進行垃圾收集,條件苛刻並且至關困難,效果也不使人滿意,因此通常不作太多考慮,能夠留做之後進一步深刻研究時使用。
在方法區上定義了OutOfMemoryError:PermGen space異常,在內存不足時拋出。
運行時常量池(Runtime Constant Pool)是方法區的一部分,用於存儲編譯期就生成的字面常量、符號引用、翻譯出來的直接引用(符號引用就是編碼是用字符串表示某個變量、接口的位置,直接引用就是根據符號引用翻譯出來的地址,將在類連接階段完成翻譯);運行時常量池除了存儲編譯期常量外,也能夠存儲在運行時間產生的常量(好比String類的intern()方法,做用是String維護了一個常量池,若是調用的字符「abc」已經在常量池中,則返回池中的字符串地址,不然,新建一個常量加入池中,並返回地址)。
6,直接內存(Direct Memory):直接內存並非JVM管理的內存,能夠這樣理解,直接內存,就是JVM之外的機器內存,好比,你有4G的內存,JVM佔用了1G,則其他的3G就是直接內存,JDK中有一種基於通道(Channel)和緩衝區(Buffer)的內存分配方式,將由C語言實現的native函數庫分配在直接內存中,用存儲在JVM堆中的DirectByteBuffer來引用。因爲直接內存收到本機器內存的限制,因此也可能出現OutOfMemoryError的異常。
通常來講,一個Java的引用訪問涉及到3個內存區域:JVM棧,堆,方法區。
以最簡單的本地變量引用:Object obj = new Object()爲例:
在Java虛擬機規範中,對於經過reference類型引用訪問具體對象的方式並未作規定,目前主流的實現方式主要有兩種:
1,經過句柄訪問(圖來自於《深刻理解Java虛擬機:JVM高級特效與最佳實現》):
經過句柄訪問的實現方式中,JVM堆中會專門有一塊區域用來做爲句柄池,存儲相關句柄所執行的實例數據地址(包括在堆中地址和在方法區中的地址)。這種實現方法因爲用句柄表示地址,所以十分穩定。
2,經過直接指針訪問:(圖來自於《深刻理解Java虛擬機:JVM高級特效與最佳實現》)
經過直接指針訪問的方式中,reference中存儲的就是對象在堆中的實際地址,在堆中存儲的對象信息中包含了在方法區中的相應類型數據。這種方法最大的優點是速度快,在HotSpot虛擬機中用的就是這種方式。
這裏所說的內存分配,主要指的是在堆上的分配,通常的,對象的內存分配都是在堆上進行,但現代技術也支持將對象拆成標量類型(標量類型即原子類型,表示單個值,能夠是基本類型或String等),而後在棧上分配,在棧上分配的不多見,咱們這裏不考慮。
Java內存分配和回收的機制歸納的說,就是:分代分配,分代回收。對象將根據存活的時間被分爲:年輕代(Young Generation)、年老代(Old Generation)、永久代(Permanent Generation,也就是方法區)。以下圖(來源於《成爲JavaGC專家part I》,http://www.importnew.com/1993.html):
年輕代(Young Generation):對象被建立時,內存的分配首先發生在年輕代(大對象能夠直接被建立在年老代),大部分的對象在建立後很快就再也不使用,所以很快變得不可達,因而被年輕代的GC機制清理掉(IBM的研究代表,98%的對象都是很快消亡的),這個GC機制被稱爲Minor GC或叫Young GC。注意,Minor GC並不表明年輕代內存不足,它事實上只表示在Eden區上的GC。
年輕代上的內存分配是這樣的,年輕代能夠分爲3個區域:Eden區(伊甸園,亞當和夏娃偷吃禁果生娃娃的地方,用來表示內存首次分配的區域,再貼切不過)和兩個存活區(Survivor 0 、Survivor 1)。內存分配過程爲(來源於《成爲JavaGC專家part I》,http://www.importnew.com/1993.html):
從上面的過程能夠看出,Eden區是連續的空間,且Survivor總有一個爲空。通過一次GC和複製,一個Survivor中保存着當前還活着的對象,而Eden區和另外一個Survivor區的內容都再也不須要了,能夠直接清空,到下一次GC時,兩個Survivor的角色再互換。所以,這種方式分配內存和清理內存的效率都極高,這種垃圾回收的方式就是著名的「中止-複製(Stop-and-copy)」清理法(將Eden區和一個Survivor中仍然存活的對象拷貝到另外一個Survivor中),這不表明着中止複製清理法很高效,其實,它也只在這種狀況下高效,若是在老年代採用中止複製,則挺悲劇的。
在Eden區,HotSpot虛擬機使用了兩種技術來加快內存分配。分別是bump-the-pointer和TLAB(Thread-Local Allocation Buffers),這兩種技術的作法分別是:因爲Eden區是連續的,所以bump-the-pointer技術的核心就是跟蹤最後建立的一個對象,在對象建立時,只須要檢查最後一個對象後面是否有足夠的內存便可,從而大大加快內存分配速度;而對於TLAB技術是對於多線程而言的,將Eden區分爲若干段,每一個線程使用獨立的一段,避免相互影響。TLAB結合bump-the-pointer技術,將保證每一個線程都使用Eden區的一段,並快速的分配內存。
年老代(Old Generation):對象若是在年輕代存活了足夠長的時間而沒有被清理掉(即在幾回Young GC後存活了下來),則會被複制到年老代,年老代的空間通常比年輕代大,能存放更多的對象,在年老代上發生的GC次數也比年輕代少。當年老代內存不足時,將執行Major GC,也叫 Full GC。
若是對象比較大(好比長字符串或大數組),Young空間不足,則大對象會直接分配到老年代上(大對象可能觸發提早GC,應少用,更應避免使用短命的大對象)。用-XX:PretenureSizeThreshold來控制直接升入老年代的對象大小,大於這個值的對象會直接分配在老年代上。
可能存在年老代對象引用新生代對象的狀況,若是須要執行Young GC,則可能須要查詢整個老年代以肯定是否能夠清理回收,這顯然是低效的。解決的方法是,年老代中維護一個512 byte的塊——」card table「,全部老年代對象引用新生代對象的記錄都記錄在這裏。Young GC時,只要查這裏便可,不用再去查所有老年代,所以性能大大提升。
GC機制的基本算法是:分代收集,這個不用贅述。下面闡述每一個分代的收集方法。
年輕代:
事實上,在上一節,已經介紹了新生代的主要垃圾回收方法,在新生代中,使用「中止-複製」算法進行清理,將新生代內存分爲2部分,1部分 Eden區較大,1部分Survivor比較小,並被劃分爲兩個等量的部分。每次進行清理時,將Eden區和一個Survivor中仍然存活的對象拷貝到 另外一個Survivor中,而後清理掉Eden和剛纔的Survivor。
這裏也能夠發現,中止複製算法中,用來複制的兩部分並不老是相等的(傳統的中止複製算法兩部份內存相等,但新生代中使用1個大的Eden區和2個小的Survivor區來避免這個問題)
因爲絕大部分的對象都是短命的,甚至存活不到Survivor中,因此,Eden區與Survivor的比例較大,HotSpot默認是 8:1,即分別佔新生代的80%,10%,10%。若是一次回收中,Survivor+Eden中存活下來的內存超過了10%,則須要將一部分對象分配到 老年代。用-XX:SurvivorRatio參數來配置Eden區域Survivor區的容量比值,默認是8,表明Eden:Survivor1:Survivor2=8:1:1.
老年代:
方法區(永久代):
永久代的回收有兩種:常量池中的常量,無用的類信息,常量的回收很簡單,沒有引用了就能夠被回收。對於無用的類進行回收,必須保證3點:
在GC機制中,起重要做用的是垃圾收集器,垃圾收集器是GC的具體實現,Java虛擬機規範中對於垃圾收集器沒有任何規定,因此不一樣廠商實現的垃圾 收集器各不相同,HotSpot 1.6版使用的垃圾收集器以下圖(圖來源於《深刻理解Java虛擬機:JVM高級特效與最佳實現》,圖中兩個收集器之間有連線,說明它們能夠配合使用):
在介紹垃圾收集器以前,須要明確一點,就是在新生代採用的中止複製算法中,「停 止(Stop-the-world)」的意義是在回收內存時,須要暫停其餘所 有線程的執行。這個是很低效的,如今的各類新生代收集器愈來愈優化這一點,但仍然只是將中止的時間變短,並未完全取消中止。
CMS收集的執行過程是:初始標記(CMS-initial-mark) -> 併發標記(CMS-concurrent-mark) -->預清理(CMS-concurrent-preclean)-->可控預清理(CMS-concurrent-abortable-preclean)-> 從新標記(CMS-remark) -> 併發清除(CMS-concurrent-sweep) ->併發重設狀態等待下次CMS的觸發(CMS-concurrent-reset)具體的說,先2次標記,1次預清理,1次從新標記,再1次清除。1,首先jvm根據 -XX:CMSInitiatingOccupancyFraction, -XX:+UseCMSInitiatingOccupancyOnly來決定什麼時間開始垃圾收集;2,若是設置了 -XX:+UseCMSInitiatingOccupancyOnly,那麼只有當old代佔用確實達到了-XX:CMSInitiatingOccupancyFraction參數所設定的比例時纔會觸發cms gc;3,若是沒有設置 -XX:+UseCMSInitiatingOccupancyOnly,那麼系統會根據統計數據自行決定何時觸發cms gc;所以有時會遇到設置了80%比例才cms gc,可是50%時就已經觸發了,就是由於這個參數沒有設置的緣由;4,當cms gc開始時,首先的階段是初始標記(CMS-initial-mark),是stop the world階段,所以此階段標記的對象只是從root集最直接可達的對象;CMS-initial-mark:961330K(1572864K),指標記時,old代的已用空間和總空間5,下一個階段是併發標記(CMS-concurrent-mark),此階段是和應用線程併發執行的,所謂併發收集器指的就是這個,主要做用是標記可達的對象,此階段不須要用戶停頓。此階段會打印2條日誌:CMS-concurrent-mark-start,CMS-concurrent-mark6,下一個階段是CMS-concurrent-preclean,此階段主要是進行一些預清理,由於標記和應用線程是併發執行的,所以會有些對象的狀態在標記後會改變,此階段正是解決這個問題由於以後的Rescan階段也會stop the world,爲了使暫停的時間儘量的小,也須要preclean階段先作一部分工做以節省時間此階段會打印2條日誌:CMS-concurrent-preclean-start,CMS-concurrent-preclean7,下一階段是CMS-concurrent-abortable-preclean階段,加入此階段的目的是使cms gc更加可控一些,做用也是執行一些預清理,以減小Rescan階段形成應用暫停的時間此階段涉及幾個參數:-XX:CMSMaxAbortablePrecleanTime:當abortable-preclean階段執行達到這個時間時纔會結束-XX:CMSScheduleRemarkEdenSizeThreshold(默認2m):控制abortable-preclean階段何時開始執行,即當eden使用達到此值時,纔會開始abortable-preclean階段-XX:CMSScheduleRemarkEdenPenetratio(默認50%):控制abortable-preclean階段何時結束執行此階段會打印一些日誌以下:CMS-concurrent-abortable-preclean-start,CMS-concurrent-abortable-preclean,CMS:abort preclean due to time XXX8,再下一個階段是第二個stop the world階段了,即Rescan階段,此階段暫停應用線程,停頓時間比並發標記小得多,但比初始標記稍長。對對象進行從新掃描並標記;YG occupancy:964861K(2403008K),指執行時young代的狀況CMS remark:961330K(1572864K),指執行時old代的狀況此外,還打印出了弱引用處理、類卸載等過程的耗時9,再下一個階段是CMS-concurrent-sweep,進行併發的垃圾清理10,最後是CMS-concurrent-reset,爲下一次cms gc重置相關數據結構有2種狀況會觸發CMS 的悲觀full gc,在悲觀full gc時,整個應用會暫停A,concurrent-mode-failure:預清理階段可能出現,當cms gc正進行時,此時有新的對象要進行old代,可是old代空間不足形成的。其可能性有:1,O區空間不足以讓新生代晉級,2,O區空間用完以前,沒法完成對無引用的對象的清理。這代表,當前有大量數據進入內存且沒法釋放。B,promotion-failed:新生代young gc可能出現,當進行young gc時,有部分young代對象仍然可用,可是S1或S2放不下,所以須要放到old代,但此時old代空間沒法容納此。影響cms gc時長及觸發的參數是如下2個:-XX:CMSMaxAbortablePrecleanTime=5000-XX:CMSInitiatingOccupancyFraction=80解決也是針對這兩個參數來的,根本的緣由是每次請求消耗的內存量過大解決方式:A,針對cms gc的觸發階段,調整 -XX:CMSInitiatingOccupancyFraction=50,提前觸發cms gc,就能夠緩解當old代達到80%,cms gc處理不完,從而形成concurrent mode failure引起full gcB,修改-XX:CMSMaxAbortablePrecleanTime=500,縮小CMS-concurrent-abortable-preclean階段的時間C,考慮到cms gc時不會進行compact,所以加入 -XX:+UseCMSCompactAtFullCollection(cms gc後會進行內存的compact)和 -XX:CMSFullGCsBeforeCompaction=4(在full gc4次後會進行compact)參數在CMS清理過程當中,只有初始標記和從新標記須要短暫停頓,併發標記和併發清除都不須要暫停用戶線程,所以效率很高,很適合高交互的場合。CMS也有缺點,它須要消耗額外的CPU和內存資源,在CPU和內存資源緊張,CPU較少時,會加劇系統負擔(CMS默認啓動線程數爲(CPU數量+3)/4)。另外,在併發收集過程當中,用戶線程仍然在運行,仍然產生內存垃圾,因此可能產生「浮動垃圾」,本次沒法清理,只能下一次Full GC才清理,所以在GC期間,須要預留足夠的內存給用戶線程使用。因此使用CMS的收集器並非老年代滿了才觸發Full GC,而是在使用了一大半(默認68%,即2/3,使用-XX:CMSInitiatingOccupancyFraction來設置)的時候就要進行Full GC,若是用戶線程消耗內存不是特別大,能夠適當調高-XX:CMSInitiatingOccupancyFraction以下降GC次數,提升性能,若是預留的用戶線程內存不夠,則會觸發Concurrent Mode Failure,此時,將觸發備用方案:使用Serial Old 收集器進行收集,但這樣停頓時間就長了,所以-XX:CMSInitiatingOccupancyFraction不宜設的過大。還有,CMS採用的是標記清除算法,會致使內存碎片的產生,可使用-XX:+UseCMSCompactAtFullCollection來設置是否在Full GC以後進行碎片整理,用-XX:CMSFullGCsBeforeCompaction來設置在執行多少次不壓縮的Full GC以後,來一次帶壓縮的Full GC。