基本收集算法 java
垃圾回收描述: 程序員
在New Generation塊中,垃圾回收通常用Copying的算法,速度快。每次GC的時候,存活下來的對象首先由Eden拷貝到某個Survivor Space, 當Survivor Space空間滿了後, 剩下的live對象就被直接拷貝到Old Generation中去。所以,每次GC後,Eden內存塊會被清空。在Old Generation塊中,垃圾回收通常用mark-compact的算法,速度慢些,但減小內存要求.
垃圾回收分多級,0級爲所有(Full)的垃圾回收,會回收OLD段中的垃圾;1級或以上爲部分垃圾回收,只會回收NEW中的垃圾,內存溢出一般發生於OLD段或Perm段垃圾回收後,仍然無內存空間容納新的Java對象的狀況。
當一個URL被訪問時,內存申請過程以下:
A. JVM會試圖爲相關Java對象在Eden中初始化一塊內存區域
B. 當Eden空間足夠時,內存申請結束。不然到下一步
C. JVM試圖釋放在Eden中全部不活躍的對象(這屬於1或更高級的垃圾回收), 釋放後若Eden空間仍然不足以放入新對象,則試圖將部分Eden中活躍對象放入Survivor區
D. Survivor區被用來做爲Eden及OLD的中間交換區域,當OLD區空間足夠時,Survivor區的對象會被移到Old區,不然會被保留在Survivor區
E. 當OLD區空間不夠時,JVM會在OLD區進行徹底的垃圾收集(0級)
F. 徹底垃圾收集後,若Survivor及OLD區仍然沒法存放從Eden複製過來的部分對象,致使JVM沒法在Eden區爲新對象建立內存區域,則出現」out of memory錯誤」 算法
JVM調優建議: 數組
ms/mx:定義YOUNG+OLD段的總尺寸,ms爲JVM啓動時YOUNG+OLD的內存大小;mx爲最大可佔用的YOUNG+OLD內存大小。在用戶生產環境上通常將這兩個值設爲相同,以減小運行期間系統在內存申請上所花的開銷。
NewSize/MaxNewSize:定義YOUNG段的尺寸,NewSize爲JVM啓動時YOUNG的內存大小;MaxNewSize爲最大可佔用的YOUNG內存大小。在用戶生產環境上通常將這兩個值設爲相同,以減小運行期間系統在內存申請上所花的開銷。
PermSize/MaxPermSize:定義Perm段的尺寸,PermSize爲JVM啓動時Perm的內存大小;MaxPermSize爲最大可佔用的Perm內存大小。在用戶生產環境上通常將這兩個值設爲相同,以減小運行期間系統在內存申請上所花的開銷。
SurvivorRatio:設置Survivor空間和Eden空間的比例 多線程
內存溢出的可能性
1. OLD段溢出
這種內存溢出是最多見的狀況之一,產生的緣由多是:
1) 設置的內存參數太小(ms/mx, NewSize/MaxNewSize)
2) 程序問題
單個程序持續進行消耗內存的處理,如循環幾千次的字符串處理,對字符串處理應建議使用StringBuffer。此時不會報內存溢出錯,卻會使系統持續垃圾收集,沒法處理其它請求,相關問題程序可經過Thread Dump獲取(見系統問題診斷一章)單個程序所申請內存過大,有的程序會申請幾十乃至幾百兆內存,此時JVM也會因沒法申請到資源而出現內存溢出,對此首先要找到相關功能,而後交予程序員修改,要找到相關程序,必須在Apache日誌中尋找。
當Java對象使用完畢後,其所引用的對象卻沒有銷燬,使得JVM認爲他仍是活躍的對象而不進行回收,這樣累計佔用了大量內存而沒法釋放。因爲目前市面上尚未對系統影響小的內存分析工具,故此時只能和程序員一塊兒定位。 併發
2. Perm段溢出
一般因爲Perm段裝載了大量的Servlet類而致使溢出,目前的解決辦法:
1) 將PermSize擴大,通常256M可以知足要求
2) 若別無選擇,則只能將servlet的路徑加到CLASSPATH中,但通常不建議這麼處理
3. C Heap溢出
系統對C Heap沒有限制,故C Heap發生問題時,Java進程所佔內存會持續增加,直到佔用全部可用系統內存 工具
其餘: 性能
JVM有2個GC線程。第一個線程負責回收Heap的Young區。第二個線程在Heap不足時,遍歷Heap,將Young 區升級爲Older區。Older區的大小等於-Xmx減去-Xmn,不能將-Xms的值設的過大,由於第二個線程被迫運行會下降JVM的性能。 優化
爲何一些程序頻繁發生GC?有以下緣由: spa
程序內調用了System.gc()或Runtime.gc()。
一些中間件軟件調用本身的GC方法,此時須要設置參數禁止這些GC。
Java的Heap過小,通常默認的Heap值都很小。
頻繁實例化對象,Release對象。此時儘可能保存並重用對象,例如使用StringBuffer()和String()。
若是你發現每次GC後,Heap的剩餘空間會是總空間的50%,這表示你的Heap處於健康狀態。許多Server端的Java程序每次GC後最好能有65%的剩餘空間。
經驗之談:
1.Server端JVM最好將-Xms和-Xmx設爲相同值。爲了優化GC,最好讓-Xmn值約等於-Xmx的1/3[2]。
2.一個GUI程序最好是每10到20秒間運行一次GC,每次在半秒以內完成[2]。
注意:
1.增長Heap的大小雖然會下降GC的頻率,但也增長了每次GC的時間。而且GC運行時,全部的用戶線程將暫停,也就是GC期間,Java應用程序不作任何工做。
2.Heap大小並不決定進程的內存使用量。進程的內存使用量要大於-Xmx定義的值,由於Java爲其餘任務分配內存,例如每一個線程的Stack等。
2.Stack的設定
每一個線程都有他本身的Stack。
-Xss |
每一個線程的Stack大小 |
Stack的大小限制着線程的數量。若是Stack過大就好致使內存溢漏。-Xss參數決定Stack大小,例如-Xss1024K。若是Stack過小,也會致使Stack溢漏。
3.硬件環境
硬件環境也影響GC的效率,例如機器的種類,內存,swap空間,和CPU的數量。
若是你的程序須要頻繁建立不少transient對象,會致使JVM頻繁GC。這種狀況你能夠增長機器的內存,來減小Swap空間的使用[2]。
4.4種GC
第一種爲單線程GC,也是默認的GC。,該GC適用於單CPU機器。
第二種爲Throughput GC,是多線程的GC,適用於多CPU,使用大量線程的程序。第二種GC與第一種GC類似,不一樣在於GC在收集Young區是多線程的,但在Old區和第一種同樣,仍然採用單線程。-XX:+UseParallelGC參數啓動該GC。
第三種爲Concurrent Low Pause GC,相似於第一種,適用於多CPU,並要求縮短因GC形成程序停滯的時間。這種GC能夠在Old區的回收同時,運行應用程序。-XX:+UseConcMarkSweepGC參數啓動該GC。
第四種爲Incremental Low Pause GC,適用於要求縮短因GC形成程序停滯的時間。這種GC能夠在Young區回收的同時,回收一部分Old區對象。-Xincgc參數啓動該GC。
1.Java堆中各代分佈:
圖1:Java堆中各代分佈
Young:主要是用來存放新生的對象。
Old:主要存放應用程序中生命週期長的內存對象。
Permanent:是指內存的永久保存區域,主要存放Class和Meta的信息,Class在被 Load的時候被放入PermGen space區域. 它和和存放Instance的Heap區域不一樣,GC(Garbage Collection)不會在主程序運行期對PermGen space進行清理,因此若是你的APP會LOAD不少CLASS的話,就極可能出現PermGen space錯誤。
2.JVM 使用的GC算法是什麼?
分代收集。
即將內存分爲幾個區域,將不一樣生命週期的對象放在不一樣區域裏;
在GC收集的時候,頻繁收集生命週期短的區域(Young area);
比較少的收集生命週期比較長的區域(Old area);
基本不收集的永久區(Perm area)。
3.GC 和 Full GC 有什麼區別?
GC(或Minor GC):收集生命週期短的區域(Young area)。
Full GC (或Major GC):收集生命週期短的區域(Young area)和生命週期比較長的區域(Old area)。
他們的收集算法不一樣,因此使用的時間也不一樣。 GC 效率也會比較高,咱們要儘可能減小 Full GC 的次數。當顯示調用System.gc() 時,gc does a full collection(both young generation andtenured generation).
4.Minor GC後,Eden是空的嗎?
是的,Minor GC會把Eden中的全部活的對象都移到Survivor區域中,若是Survivor區中放不下,那麼剩下的活的對象就被移到Old generation 中。
5.Garbage collection options(JDK1.4):
圖2:GC參數
堆設置
-Xms :初始堆大小
-Xmx :最大堆大小
-XX:NewSize=n :設置年輕代大小
-XX:NewRatio=n: 設置年輕代和年老代的比值。如:爲3,表示年輕代與年老代比值爲1:3,年輕代佔整個年輕代年老代和的1/4
-XX:SurvivorRatio=n :年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區佔整個年輕代的1/5
-XX:MaxPermSize=n :設置持久代大小
收集器設置
-XX:+UseSerialGC :設置串行收集器
-XX:+UseParallelGC :設置並行收集器
-XX:+UseParalledlOldGC :設置並行年老代收集器
-XX:+UseConcMarkSweepGC :設置併發收集器
垃圾回收統計信息
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-Xloggc:filename
並行收集器設置
-XX:ParallelGCThreads=n :設置並行收集器收集時使用的CPU數。並行收集線程數。
-XX:MaxGCPauseMillis=n :設置並行收集最大暫停時間
-XX:GCTimeRatio=n :設置垃圾回收時間佔程序運行時間的百分比。公式爲1/(1+n)
併發收集器設置
-XX:+CMSIncrementalMode :設置爲增量模式。適用於單CPU狀況。
-XX:ParallelGCThreads=n :設置併發收集器年輕代收集方式爲並行收集時,使用的CPU數。並行收集線程數。
6.例子:Heap size 設置
場景:在JAVA_HOME下demo/jfc/SwingSet2/目錄下執行下面的命令:
java -jar -Xmn4m -Xms16m -Xmx16mSwingSet2.jar
系統輸出:
Exception in thread "Image Fetcher 0" java.lang.OutOfMemoryError: Java heap space Exception in thread "Image Fetcher 3" java.lang.OutOfMemoryError: Java heap space Exception in thread "Image Fetcher 1" java.lang.OutOfMemoryError: Java heap space Exception in thread 「Image Fetcher 2」 java.lang.OutOfMemoryError: Java heap space |
調優:將-Xms和-Xmx選項設置爲32m,而-Xmn爲1/4的-Xmx值。
結果:執行java -jar –Xmn8m –Xms32m -Xmx32m SwingSet2.jar,系統正常運行。
7.JVM Runtime DataArea(運行時數據區):
圖3:JVM運行時數據區(一)
Heap: JVM只有一個爲全部線程所共享的堆,全部的類實例和數組都是在堆中建立的。
Method area: JVM只有一個爲全部的線程所共享的方法區。它存儲類結構,例如運行時常量池,成員和方法數據以及方法、構造方法的代碼。
Java Stacks: 每一個JVM線程擁有一個私有的棧。
Pc registers: JVM能夠同時支持運行多個線程,所以每一個線程須要各自的PC(program counter)寄存器。
Native method stacks: 保存native方法進入區域的地址 。
圖4:JVM運行時數據區(二)
Heap和Method area被全部線程共享,其生存期和JVM的生存期相同;Java Stacks、Pc registers、Native method stacks被每一個線程獨自擁有,其生存期和線程的生存期相同。
8. 常見的內存泄露錯誤
不少開發人員都碰到過java.lang.OutOfMemoryError的錯誤。這種錯誤又分兩種:java.lang.OutOfMemoryError: Java heap space和java.lang.OutOfMemoryError:PermGen space。引發這種錯誤的緣由多是程序問題,也多是是JVM參數配置問題引發的。如果參數問題,前者能夠同過配置-Xms和-Xmx參數來設置,然後者能夠經過配置 -XX:PermSize和-XX:MaxPermSize來設置。
http://blog.csdn.net/stefanie860624/article/details/7514597