最基礎的收集算法是「標記-清除」(Mark-Sweep)算法,如同它的名字同樣,算法分
爲「標記」和「清除」兩個階段:首先標記出全部須要回收的對象,在標記完成後統一回收全部
被標記的對象,它的標記過程其實在前一節講述對象標記斷定時已經介紹過了。之因此說它
是最基礎的收集算法,是由於後續的收集算法都是基於這種思路並對其不足進行改進而獲得
的。它的主要不足有兩個:一個是效率問題,標記和清除兩個過程的效率都不高;另外一個是
空間問題,標記清除以後會產生大量不連續的內存碎片,空間碎片太多可能會致使之後在程
序運行過程當中須要分配較大對象時,沒法找到足夠的連續內存而不得不提早觸發另外一次垃圾
收集動做。算法
爲了解決效率問題,一種稱爲「複製」(Copying)的收集算法出現了,它將可用內存按容
量劃分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊的內存用完了,就將還存活着
的對象複製到另一塊上面,而後再把已使用過的內存空間一次清理掉。這樣使得每次都是
對整個半區進行內存回收,內存分配時也就不用考慮內存碎片等複雜狀況,只要移動堆頂指
針,按順序分配內存便可,實現簡單,運行高效。只是這種算法的代價是將內存縮小爲了原
來的一半,未免過高了一點。markdown
如今的商業虛擬機都採用這種收集算法來回收新生代,IBM公司的專門研究代表,新生
代中的對象98%是「朝生夕死」的,因此並不須要按照1:1的比例來劃份內存空間,而是將內存
分爲一塊較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor [1] 。
當回收時,將Eden和Survivor中還存活着的對象一次性地複製到另一塊Survivor空間上,最
後清理掉Eden和剛纔用過的Survivor空間。HotSpot虛擬機默認Eden和Survivor的大小比例是
8:1,也就是每次新生代中可用內存空間爲整個新生代容量的90%(80%+10%),只有10%
的內存會被「浪費」。固然,98%的對象可回收只是通常場景下的數據,咱們沒有辦法保證每
次回收都只有很少於10%的對象存活,當Survivor空間不夠用時,須要依賴其餘內存(這裏
指老年代)進行分配擔保(Handle Promotion)。對象
複製收集算法在對象存活率較高時就要進行較多的複製操做,效率將會變低。更關鍵的
是,若是不想浪費50%的空間,就須要有額外的空間進行分配擔保,以應對被使用的內存中
全部對象都100%存活的極端狀況,因此在老年代通常不能直接選用這種算法。
根據老年代的特色,有人提出了另一種「標記-整理」(Mark-Compact)算法,標記過程
仍然與「標記-清除」算法同樣,但後續步驟不是直接對可回收對象進行清理,而是讓全部存
活的對象都向一端移動,而後直接清理掉端邊界之外的內存圖片
當前商業虛擬機的垃圾收集都採用「分代收集」(Generational Collection)算法,這種算
法並無什麼新的思想,只是根據對象存活週期的不一樣將內存劃分爲幾塊。通常是把Java堆
分爲新生代和老年代,這樣就能夠根據各個年代的特色採用最適當的收集算法。在新生代
中,每次垃圾收集時都發現有大批對象死去,只有少許存活,那就選用複製算法,只須要付
出少許存活對象的複製成本就能夠完成收集。而老年代中由於對象存活率高、沒有額外空間
對它進行分配擔保,就必須使用「標記—清理」或者「標記—整理」算法來進行回收。內存