轉:http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.htmlhtml
無論是YGC仍是Full GC,GC過程當中都會對致使程序運行中中斷,正確的選擇不一樣的GC策略,調整JVM、GC的參數,能夠極大的減小因爲GC工做,而致使的程序運行中斷方面的問題,進而適當的提升Java程序的工做效率。可是調整GC是以個極爲複雜的過程,因爲各個程序具有不一樣的特色,如:web和GUI程序就有很大區別(Web能夠適當的停頓,但GUI停頓是客戶沒法接受的),並且因爲跑在各個機器上的配置不一樣(主要cup個數,內存不一樣),因此使用的GC種類也會不一樣(如何選擇見GC種類及如何選擇)。本文將注重介紹JVM、GC的一些重要參數的設置來提升系統的性能。java
JVM內存組成及GC相關內容請見以前的文章:JVM內存組成 GC策略&內存申請。web
JVM參數的含義 實例見實例分析算法
參數名稱 | 含義 | 默認值 | |
-Xms | 初始堆大小 | 物理內存的1/64(<1GB) | 默認(MinHeapFreeRatio參數能夠調整)空餘堆內存小於40%時,JVM就會增大堆直到-Xmx的最大限制. |
-Xmx | 最大堆大小 | 物理內存的1/4(<1GB) | 默認(MaxHeapFreeRatio參數能夠調整)空餘堆內存大於70%時,JVM會減小堆直到 -Xms的最小限制 |
-Xmn | 年輕代大小(1.4or lator) | 注意:此處的大小是(eden+ 2 survivor space).與jmap -heap中顯示的New gen是不一樣的。 整個堆大小=年輕代大小 + 年老代大小 + 持久代大小. 增大年輕代後,將會減少年老代大小.此值對系統性能影響較大,Sun官方推薦配置爲整個堆的3/8 |
|
-XX:NewSize | 設置年輕代大小(for 1.3/1.4) | ||
-XX:MaxNewSize | 年輕代最大值(for 1.3/1.4) | ||
-XX:PermSize | 設置持久代(perm gen)初始值 | 物理內存的1/64 | |
-XX:MaxPermSize | 設置持久代最大值 | 物理內存的1/4 | |
-Xss | 每一個線程的堆棧大小 | JDK5.0之後每一個線程堆棧大小爲1M,之前每一個線程堆棧大小爲256K.更具應用的線程所需內存大小進行 調整.在相同物理內存下,減少這個值能生成更多的線程.可是操做系統對一個進程內的線程數仍是有限制的,不能無限生成,經驗值在3000~5000左右 通常小的應用, 若是棧不是很深, 應該是128k夠用的 大的應用建議使用256k。這個選項對性能影響比較大,須要嚴格的測試。(校長) 和threadstacksize選項解釋很相似,官方文檔彷佛沒有解釋,在論壇中有這樣一句話:"」 -Xss is translated in a VM flag named ThreadStackSize」 通常設置這個值就能夠了。 |
|
-XX:ThreadStackSize | Thread Stack Size | (0 means use default stack size) [Sparc: 512; Solaris x86: 320 (was 256 prior in 5.0 and earlier); Sparc 64 bit: 1024; Linux amd64: 1024 (was 0 in 5.0 and earlier); all others 0.] | |
-XX:NewRatio | 年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代) | -XX:NewRatio=4表示年輕代與年老代所佔比值爲1:4,年輕代佔整個堆棧的1/5 Xms=Xmx而且設置了Xmn的狀況下,該參數不須要進行設置。 |
|
-XX:SurvivorRatio | Eden區與Survivor區的大小比值 | 設置爲8,則兩個Survivor區與一個Eden區的比值爲2:8,一個Survivor區佔整個年輕代的1/10 | |
-XX:LargePageSizeInBytes | 內存頁的大小不可設置過大, 會影響Perm的大小 | =128m | |
-XX:+UseFastAccessorMethods | 原始類型的快速優化 | ||
-XX:+DisableExplicitGC | 關閉System.gc() | 這個參數須要嚴格的測試 | |
-XX:MaxTenuringThreshold | 垃圾最大年齡 | 若是設置爲0的話,則年輕代對象不通過Survivor區,直接進入年老代. 對於年老代比較多的應用,能夠提升效率.若是將此值設置爲一個較大值,則年輕代對象會在Survivor區進行屢次複製,這樣能夠增長對象再年輕代的存活 時間,增長在年輕代即被回收的機率 該參數只有在串行GC時纔有效. |
|
-XX:+AggressiveOpts | 加快編譯 | ||
-XX:+UseBiasedLocking | 鎖機制的性能改善 | ||
-Xnoclassgc | 禁用垃圾回收 | ||
-XX:SoftRefLRUPolicyMSPerMB | 每兆堆空閒空間中SoftReference的存活時間 | 1s | softly reachable objects will remain alive for some amount of time after the last time they were referenced. The default value is one second of lifetime per free megabyte in the heap |
-XX:PretenureSizeThreshold | 對象超過多大是直接在舊生代分配 | 0 | 單位字節 新生代採用Parallel Scavenge GC時無效 另外一種直接在舊生代分配的狀況是大的數組對象,且數組中無外部引用對象. |
-XX:TLABWasteTargetPercent | TLAB佔eden區的百分比 | 1% | |
-XX:+CollectGen0First | FullGC時是否先YGC | false |
並行收集器相關參數數組
-XX:+UseParallelGC | Full GC採用parallel MSC (此項待驗證) |
選擇垃圾收集器爲並行收集器.此配置僅對年輕代有效.即上述配置下,年輕代使用併發收集,而年老代仍舊使用串行收集.(此項待驗證)緩存 |
|
-XX:+UseParNewGC | 設置年輕代爲並行收集 | 可與CMS收集同時使用 JDK5.0以上,JVM會根據系統配置自行設置,因此無需再設置此值 |
|
-XX:ParallelGCThreads | 並行收集器的線程數 | 此值最好配置與處理器數目相等 一樣適用於CMS | |
-XX:+UseParallelOldGC | 年老代垃圾收集方式爲並行收集(Parallel Compacting) | 這個是JAVA 6出現的參數選項 | |
-XX:MaxGCPauseMillis | 每次年輕代垃圾回收的最長時間(最大暫停時間) | 若是沒法知足此時間,JVM會自動調全年輕代大小,以知足此值. | |
-XX:+UseAdaptiveSizePolicy | 自動選擇年輕代區大小和相應的Survivor區比例 | 設置此選項後,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直打開. | |
-XX:GCTimeRatio | 設置垃圾回收時間佔程序運行時間的百分比 | 公式爲1/(1+n) | |
-XX:+ScavengeBeforeFullGC | Full GC前調用YGC | true | Do young generation GC prior to a full GC. (Introduced in 1.4.1.) |
CMS相關參數服務器
-XX:+UseConcMarkSweepGC | 使用CMS內存收集 | 測試中配置這個之後,-XX:NewRatio=4的配置失效了,緣由不明.因此,此時年輕代大小最好用-Xmn設置.??? | |
-XX:+AggressiveHeap | 試圖是使用大量的物理內存 長時間大內存使用的優化,能檢查計算資源(內存, 處理器數量) 至少須要256MB內存 大量的CPU/內存, (在1.4.1在4CPU的機器上已經顯示有提高) |
||
-XX:CMSFullGCsBeforeCompaction | 多少次後進行內存壓縮 | 因爲併發收集器不對內存空間進行壓縮,整理,因此運行一段時間之後會產生"碎片",使得運行效率下降.此值設置運行多少次GC之後對內存空間進行壓縮,整理. | |
-XX:+CMSParallelRemarkEnabled | 下降標記停頓 | ||
-XX+UseCMSCompactAtFullCollection | 在FULL GC的時候, 對年老代的壓縮 | CMS是不會移動內存的, 所以, 這個很是容易產生碎片, 致使內存不夠用, 所以, 內存的壓縮這個時候就會被啓用。 增長這個參數是個好習慣。 可能會影響性能,可是能夠消除碎片 |
|
-XX:+UseCMSInitiatingOccupancyOnly | 使用手動定義初始化定義開始CMS收集 | 禁止hostspot自行觸發CMS GC | |
-XX:CMSInitiatingOccupancyFraction=70 | 使用cms做爲垃圾回收 使用70%後開始CMS收集 |
92 | 爲了保證不出現promotion failed(見下面介紹)錯誤,該值的設置須要知足如下公式CMSInitiatingOccupancyFraction計算公式 |
-XX:CMSInitiatingPermOccupancyFraction | 設置Perm Gen使用到達多少比率時觸發 | 92 | |
-XX:+CMSIncrementalMode | 設置爲增量模式 | 用於單CPU狀況 | |
-XX:+CMSClassUnloadingEnabled |
輔助信息併發
-XX:+PrintGC | 輸出形式:app [GC 118250K->113543K(130112K), 0.0094143 secs] |
||
-XX:+PrintGCDetails | 輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] |
||
-XX:+PrintGCTimeStamps | |||
-XX:+PrintGC:PrintGCTimeStamps | 可與-XX:+PrintGC -XX:+PrintGCDetails混合使用 輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs] |
||
-XX:+PrintGCApplicationStoppedTime | 打印垃圾回收期間程序暫停的時間.可與上面混合使用 | 輸出形式:Total time for which application threads were stopped: 0.0468229 seconds | |
-XX:+PrintGCApplicationConcurrentTime | 打印每次垃圾回收前,程序未中斷的執行時間.可與上面混合使用 | 輸出形式:Application time: 0.5291524 seconds | |
-XX:+PrintHeapAtGC | 打印GC先後的詳細堆棧信息 | ||
-Xloggc:filename | 把相關日誌信息記錄到文件以便分析. 與上面幾個配合使用 |
||
-XX:+PrintClassHistogram |
garbage collects before printing the histogram. | ||
-XX:+PrintTLAB | 查看TLAB空間的使用狀況 | ||
XX:+PrintTenuringDistribution | 查看每次minor GC後新的存活週期的閾值 | Desired survivor size 1048576 bytes, new threshold 7 (max 15) |
GC性能方面的考慮
對於GC的性能主要有2個方面的指標:吞吐量throughput(工做時間不算gc的時間佔總的時間比)和暫停pause(gc發生時app對外顯示的沒法響應)。
1. Total Heap
默認狀況下,vm會增長/減小heap大小以維持free space在整個vm中佔的比例,這個比例由MinHeapFreeRatio和MaxHeapFreeRatio指定。
通常而言,server端的app會有如下規則:
2. The Young Generation
另一個對於app流暢性運行影響的因素是young generation的大小。young generation越大,minor collection越少;可是在固定heap size狀況下,更大的young generation就意味着小的tenured generation,就意味着更多的major collection(major collection會引起minor collection)。
NewRatio反映的是young和tenured generation的大小比例。NewSize和MaxNewSize反映的是young generation大小的下限和上限,將這兩個值設爲同樣就固定了young generation的大小(同Xms和Xmx設爲同樣)。
若是但願,SurvivorRatio也能夠優化survivor的大小,不過這對於性能的影響不是很大。SurvivorRatio是eden和survior大小比例。
通常而言,server端的app會有如下規則:
經驗&&規則
promotion failed:
垃圾回收時promotion failed是個很頭痛的問題,通常多是兩種緣由產生,第一個緣由是救助空間不夠,救助空間裏的對象還不該該被移動到年老代,但年輕代又有不少對象須要放入救助空間;第二個緣由是年老代沒有足夠的空間接納來自年輕代的對象;這兩種狀況都會轉向Full GC,網站停頓時間較長。
解決方方案一:
第一個緣由個人最終解決辦法是去掉救助空間,設置-XX:SurvivorRatio=65536 -XX:MaxTenuringThreshold=0便可,第二個緣由個人解決辦法是設置CMSInitiatingOccupancyFraction爲某個值(假設70),這樣年老代空間到70%時就開始執行CMS,年老代有足夠的空間接納來自年輕代的對象。
解決方案一的改進方案:
又有改進了,上面方法不太好,由於沒有用到救助空間,因此年老代容易滿,CMS執行會比較頻繁。我改善了一下,仍是用救助空間,可是把救助空間加大,這樣也不會有promotion failed。具體操做上,32位Linux和64位Linux好像不同,64位系統彷佛只要配置MaxTenuringThreshold參數,CMS仍是有暫停。爲了解決暫停問題和promotion failed問題,最後我設置-XX:SurvivorRatio=1 ,並把MaxTenuringThreshold去掉,這樣即沒有暫停又不會有promotoin failed,並且更重要的是,年老代和永久代上升很是慢(由於好多對象到不了年老代就被回收了),因此CMS執行頻率很是低,好幾個小時才執行一次,這樣,服務器都不用重啓了。
-Xmx4000M -Xms4000M -Xmn600M -XX:PermSize=500M -XX:MaxPermSize=500M -Xss256K -XX:+DisableExplicitGC -XX:SurvivorRatio=1 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:+CMSParallelRemarkEnabled -XX:+UseCMSCompactAtFullCollection -XX:CMSFullGCsBeforeCompaction=0 -XX:+CMSClassUnloadingEnabled -XX:LargePageSizeInBytes=128M -XX:+UseFastAccessorMethods -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=80 -XX:SoftRefLRUPolicyMSPerMB=0 -XX:+PrintClassHistogram -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC -Xloggc:log/gc.log
CMSInitiatingOccupancyFraction值與Xmn的關係公式
上面介紹了promontion faild產生的緣由是EDEN空間不足的狀況下將EDEN與From survivor中的存活對象存入To survivor區時,To survivor區的空間不足,再次晉升到old gen區,而old gen區內存也不夠的狀況下產生了promontion faild從而致使full gc.那能夠推斷出:eden+from survivor < old gen區剩餘內存時,不會出現promontion faild的狀況,即:
(Xmx-Xmn)*(1-CMSInitiatingOccupancyFraction/100)>=(Xmn-Xmn/(SurvivorRatior+2)) 進而推斷出:
CMSInitiatingOccupancyFraction <=((Xmx-Xmn)-(Xmn-Xmn/(SurvivorRatior+2)))/(Xmx-Xmn)*100
例如:
當xmx=128 xmn=36 SurvivorRatior=1時 CMSInitiatingOccupancyFraction<=((128.0-36)-(36-36/(1+2)))/(128-36)*100 =73.913
當xmx=128 xmn=24 SurvivorRatior=1時 CMSInitiatingOccupancyFraction<=((128.0-24)-(24-24/(1+2)))/(128-24)*100=84.615…
當xmx=3000 xmn=600 SurvivorRatior=1時 CMSInitiatingOccupancyFraction<=((3000.0-600)-(600-600/(1+2)))/(3000-600)*100=83.33
CMSInitiatingOccupancyFraction低於70% 須要調整xmn或SurvivorRatior值。
令:
網上一童鞋推斷出的公式是::(Xmx-Xmn)*(100-CMSInitiatingOccupancyFraction)/100>=Xmn 這個公式我的認爲不是很嚴謹,在內存小的時候會影響xmn的計算。