GC(二)

時間 2019-11-09

原文原文鏈接

接gc(一)算法

怎麼回收垃圾負載均衡

在肯定了哪些垃圾能夠被回收後，垃圾收集器要作的事情就是開始進行垃圾回收，可是這裏面涉及到一個問題是：如何高效地進行垃圾回收。因爲Java虛擬機規範並無對如何實現垃圾收集器作出明確的規定，所以各個廠商的虛擬機能夠採用不一樣的方式來實現垃圾收集器，這裏咱們討論幾種常見的垃圾收集算法的核心思想。spa

標記 --- 清除算法cdn

標記清除算法（Mark-Sweep）是最基礎的一種垃圾回收算法，它分爲2部分，先把內存區域中的這些對象進行標記，哪些屬於可回收標記出來，而後把這些垃圾拎出來清理掉。就像上圖同樣，清理掉的垃圾就變成未使用的內存區域，等待被再次使用。對象

這邏輯再清晰不過了，而且也很好操做，但它存在一個很大的問題，那就是內存碎片。blog

上圖中等方塊的假設是 2M，小一些的是 1M，大一些的是 4M。等咱們回收完，內存就會切成了不少段。咱們知道開闢內存空間時，須要的是連續的內存區域，這時候咱們須要一個 2M的內存區域，其中有2個 1M 是無法用的。這樣就致使，其實咱們自己還有這麼多的內存的，但卻用不了。內存

複製算法虛擬機

複製算法（Copying）是在標記清除算法上演化而來，解決標記清除算法的內存碎片問題。它將可用內存按容量劃分爲大小相等的兩塊，每次只使用其中的一塊。當這一塊的內存用完了，就將還存活着的對象複製到另一塊上面，而後再把已使用過的內存空間一次清理掉。保證了內存的連續可用，內存分配時也就不用考慮內存碎片等複雜狀況，邏輯清晰，運行高效。it

上面的圖很清楚，也很明顯的暴露了另外一個問題，合着我這140平的大三房，只能當70平米的小兩房來使？代價實在過高。io

標記整理算法

標記整理算法（Mark-Compact）標記過程仍然與標記 --- 清除算法同樣，但後續步驟不是直接對可回收對象進行清理，而是讓全部存活的對象都向一端移動，再清理掉端邊界之外的內存區域。

標記整理算法一方面在標記-清除算法上作了升級，解決了內存碎片的問題，也規避了複製算法只能利用一半內存區域的弊端。看起來很美好，但從上圖能夠看到，它對內存變更更頻繁，須要整理全部存活對象的引用地址，在效率上比複製算法要差不少。

分代收集算法分代收集算法（Generational Collection）嚴格來講並非一種思想或理論，而是融合上述3種基礎的算法思想，而產生的針對不一樣狀況所採用不一樣算法的一套組合拳。對象存活週期的不一樣將內存劃分爲幾塊。通常是把 Java 堆分爲新生代和老年代，這樣就能夠根據各個年代的特色採用最適當的收集算法。在新生代中，每次垃圾收集時都發現有大批對象死去，只有少許存活，那就選用複製算法，只須要付出少許存活對象的複製成本就能夠完成收集。而老年代中由於對象存活率高、沒有額外空間對它進行分配擔保，就必須使用標記-清理或者標記 --- 整理算法來進行回收。so，另外一個問題來了，那內存區域到底被分爲哪幾塊，每一塊又有什麼特別適合什麼算法呢？

內存模型與回收策略

Java 堆（Java Heap）是JVM所管理的內存中最大的一塊，堆又是垃圾收集器管理的主要區域，這裏咱們主要分析一下 Java 堆的結構。

Java 堆主要分爲2個區域-年輕代與老年代，其中年輕代又分 Eden 區和 Survivor 區，其中 Survivor 區又分 From 和 To 2個區。可能這時候你們會有疑問，爲何須要 Survivor 區，爲何Survivor 還要分2個區。不着急，咱們從頭至尾，看看對象究竟是怎麼來的，而它又是怎麼沒的。

Eden 區

IBM 公司的專業研究代表，有將近98%的對象是朝生夕死，因此針對這一現狀，大多數狀況下，對象會在新生代 Eden 區中進行分配，當 Eden 區沒有足夠空間進行分配時，虛擬機會發起一次 Minor GC，Minor GC 相比 Major GC 更頻繁，回收速度也更快。經過 Minor GC 以後，Eden 會被清空，Eden 區中絕大部分對象會被回收，而那些無需回收的存活對象，將會進到 Survivor 的 From 區（若 From 區不夠，則直接進入 Old 區）。

Survivor 區

Survivor 區至關因而 Eden 區和 Old 區的一個緩衝，相似於咱們交通燈中的黃燈。Survivor 又分爲2個區，一個是 From 區，一個是 To 區。每次執行 Minor GC，會將 Eden 區和 From 存活的對象放到 Survivor 的 To 區（若是 To 區不夠，則直接進入 Old 區）。

爲啥須要？

不就是新生代到老年代麼，直接 Eden 到 Old 很差了嗎，爲啥要這麼複雜。想一想若是沒有 Survivor 區，Eden 區每進行一次 Minor GC，存活的對象就會被送到老年代，老年代很快就會被填滿。而有不少對象雖然一次 Minor GC 沒有消滅，但其實也並不會蹦躂多久，或許第二次，第三次就須要被清除。這時候移入老年區，很明顯不是一個明智的決定。

因此，Survivor 的存在乎義就是減小被送到老年代的對象，進而減小 Major GC 的發生。Survivor 的預篩選保證，只有經歷16次 Minor GC 還能在新生代中存活的對象，纔會被送到老年代。

爲啥須要倆？

設置兩個 Survivor 區最大的好處就是解決內存碎片化。

咱們先假設一下，Survivor 若是隻有一個區域會怎樣。Minor GC 執行後，Eden 區被清空了，存活的對象放到了 Survivor 區，而以前 Survivor 區中的對象，可能也有一些是須要被清除的。問題來了，這時候咱們怎麼清除它們？在這種場景下，咱們只能標記清除，而咱們知道標記清除最大的問題就是內存碎片，在新生代這種常常會消亡的區域，採用標記清除必然會讓內存產生嚴重的碎片化。由於 Survivor 有2個區域，因此每次 Minor GC，會將以前 Eden 區和 From 區中的存活對象複製到 To 區域。第二次 Minor GC 時，From 與 To 職責兌換，這時候會將 Eden 區和 To 區中的存活對象再複製到 From 區域，以此反覆。

這種機制最大的好處就是，整個過程當中，永遠有一個 Survivor space 是空的，另外一個非空的 Survivor space 是無碎片的。那麼，Survivor 爲何不分更多塊呢？比方說分紅三個、四個、五個?顯然，若是 Survivor 區再細分下去，每一塊的空間就會比較小，容易致使 Survivor 區滿，兩塊 Survivor 區多是通過權衡以後的最佳方案。

Old 區

老年代佔據着2/3的堆內存空間，只有在 Major GC 的時候纔會進行清理，每次 GC 都會觸發「Stop-The-World」。內存越大，STW 的時間也越長，因此內存也不只僅是越大就越好。因爲複製算法在對象存活率較高的老年代會進行不少次的複製操做，效率很低，因此老年代這裏採用的是標記 --- 整理算法。

除了上述所說，在內存擔保機制下，沒法安置的對象會直接進到老年代，如下幾種狀況也會進入老年代。

大對象

大對象指須要大量連續內存空間的對象，這部分對象不論是不是「朝生夕死」，都會直接進到老年代。這樣作主要是爲了不在 Eden 區及2個 Survivor 區之間發生大量的內存複製。當你的系統有很是多「朝生夕死」的大對象時，得注意了。

長期存活對象

虛擬機給每一個對象定義了一個對象年齡（Age）計數器。正常狀況下對象會不斷的在 Survivor 的 From 區與 To 區之間移動，對象在 Survivor 區中每經歷一次 Minor GC，年齡就增長1歲。當年齡增長到15歲時，這時候就會被轉移到老年代。固然，這裏的15，JVM 也支持進行特殊設置。

動態對象年齡

虛擬機並不重視要求對象年齡必須到15歲，纔會放入老年區，若是 Survivor 空間中相同年齡全部對象大小的總合大於 Survivor 空間的一半，年齡大於等於該年齡的對象就能夠直接進去老年區，無需等你「成年」。

這其實有點相似於負載均衡，輪詢是負載均衡的一種，保證每臺機器都分得一樣的請求。看似很均衡，但每臺機的硬件不通，健康情況不一樣，咱們還能夠基於每臺機接受的請求數，或每臺機的響應時間等，來調整咱們的負載均衡算法。

note:環境不會改變，解決之道在於改變本身。

1. GC（二）
2. 淺談GC---二
3. JVM GC筆記二
4. .NET GC 精要(二)
5. JVM學習筆記（二）——GC
6. jvm-GC收集器（二）
7. JVM（二）：GC垃圾收集
8. JVM GC 學習筆記（二）
9. JVM學習筆記二：GC
10. Minor GC(Young GC)、Full GC、Major GC、Old GC
更多相關文章...
• Hibernate的二級緩存 - Hibernate教程
• MySQL BIT、BINARY、VARBINARY、BLOB（二進制類型） - MySQL教程
• RxJava操作符（二）Transforming Observables
• Kotlin學習（二）基本類型

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。