php7 垃圾回收機制詳解

本文出錯,沒有參考價值php

本文出錯,沒有參考價值html

本文出錯,沒有參考價值git

本文出錯,沒有參考價值github

本文出錯,沒有參考價值算法

筆者前幾天對這個話題感興趣,因而到網上一搜,幾乎都是 php 5的垃圾回收機制,雖然 php5 到 php7 GC部分作出的改動較小,但我以爲仍是有必要單獨作一遍博文出來。 不特地說明的話 php 版本爲 7.2

在php中的變量佔用的空間,是不須要咱們手動回收的。內核幫咱們處理了這一部分的工做。相比C,這大大方便了咱們的操做。segmentfault

本篇主要講解 變量的 GC機制數組

在瞭解咱們 php GC 時,我以爲我有必要介紹一下們的 php 的變量在底層的實現。緩存

zval 的結構

// php 變量對於的c結構體
struct _zval_struct {
    zend_value value;
    union {
       ……
    } u1;
    union {
        ……
    } u2;
};

因爲主要講垃圾回收,因此在這裏簡單介紹下 u1 u2 聯合體的功能
u1 結構比較複雜,我認爲主要是用於識別變量類型
u2 這裏面大多都是輔助字段,變量內部功能的實現、提高緩存友好性等等
接下來是咱們的主角 php7

zend_value 它也是結構體中內嵌的一個聯合體ui

typedef union _zend_value {
    zend_long         lval;//整形
    double            dval;//浮點型
    zend_refcounted  *counted;//獲取不一樣類型的gc頭部
    zend_string      *str;//string字符串
    zend_array       *arr;//數組
    zend_object      *obj;//對象
    zend_resource    *res;//資源
    zend_reference   *ref;//是不是引用類型
  
    // 忽略下面的結構,與咱們討論無關
    zend_ast_ref     *ast;
    zval             *zv;
    void             *ptr;
    zend_class_entry *ce;
    zend_function    *func;
    struct {
        ZEND_ENDIAN_LOHI(
            uint32_t w1,
            uint32_t w2)
    } ww;
} zend_value;

zval的 value中就記錄了引用計數zend_refcounted *counted這個類型,咱們的垃圾回收機制也是基於此的。

typedef struct _zend_refcounted_h {
    uint32_t         refcount;          /* reference counter 32-bit */
    union {
        struct {
            ZEND_ENDIAN_LOHI_3(
                zend_uchar    type,
                zend_uchar    flags,    /* used for strings & objects */
                uint16_t      gc_info)  /* keeps GC root number (or 0) and color */
        } v;
        uint32_t type_info;
    } u;
} zend_refcounted_h;

全部的複雜類型的定義, 開始的時候都是zend_refcounted_h結構, 這個結構裏除了引用計數之外, 還有GC相關的結構. 從而在作GC回收的時候, GC不須要關心具體類型是什麼, 全部的它均可以當作zend_refcounted*結構來處理.

變量的自動回收

在php中 除了 arrayobject類型的變量,其他大部分是自動回收
php 普通變量的回收和 該變量的引用次數有關。

官方的例子

$a = 1;
$b = $a;
xdebug_debug_zval('a');
$a =10;
xdebug_debug_zval('a');
unset($a);
xdebug_debug_zval('a');

結果

a:
(refcount=2, is_ref=0),int 1
a:
(refcount=1, is_ref=0),int 10
a: no such symbol

能夠看到 當$a =10 的時候 涉及到 php的COW(copy-on-write)機制,$b 會複製一份原先的 $a ,解除了他們之間的引用關係,因此a的引用次數(refcount)減小爲1。

而後咱們uset($a)以後 a的引用次數變爲0。這就會被認爲是垃圾變量,釋放空間。

在舉一個例子

$a = [1];
$a[1] = &$a;
unset($a);

在 unset($a) 以前 $a 的類型爲引用類型

a:
(refcount=2, is_ref=1),
array (size=2)
  0 => (refcount=1, is_ref=0),int 1
  1 => (refcount=2, is_ref=1),
    &array<

unset($a) 以後,就變成這樣

這時候,咱們unset操做時refcount 由2變爲1,由於有內部引用指向 $a,因此在外部 其所佔用的空間並不會被銷燬。

而後咱們的外部引用已經被中斷了,咱們也不能使用它。它就成了一個「孤兒」,在c語言中叫作野指針。在php中叫作循環引用。內存泄漏。想要銷燬變量的話,只能等 php腳本結束。

循環引用形成的內存泄漏

爲了清理這些垃圾,引入了兩個準則

  • 若是引用計數減小到零,所在變量容器將被清除(free),不屬於垃圾
  • 若是一個zval 的引用計數減小後還大於0,那麼它會進入垃圾週期。其次,在一個垃圾週期中,經過檢查引用計數是否減1,而且檢查哪些變量容器的引用次數是零,來發現哪部分是垃圾。

循環引用基本上只會出如今 數組和對象中,對象是由於它的自己就是引用

object和array的回收過程

php7的垃圾回收包含兩個部分,一個是垃圾收集器,一個是垃圾回收算法。

垃圾收集器,把剛剛提到的,多是垃圾的元素收集到回收池中 也就是把變量的 zend_refcount的信息 放在回收池中。 當回收池的值達到必定額度了,會進行統一處理。

處理的過程呢,就比較簡單。

遍歷回收池中的每個變量,根據每個變量,再遍歷每個成員,若是成員還有嵌套的話繼續遍歷。而後把全部成員的 作模擬的 refcount -1。若是此時外部的變量的 引用次數爲 0 。那麼能夠視爲垃圾,清楚。若是大於0,那麼恢復引用次數,並從垃圾回收池中取出。

垃圾回收的原理

若是你這個變量不是垃圾,那麼它的全部成員變量的引用減一以後,必然不會是總變量的引用爲0。

例子

說的比較死,不如舉個例子。剛刷 sf.gg 的時候看到一道關於 GC 的題,我回答了一波。關於GC垃圾回收機制

題目以下
題目

//個人回答
一、只要zval.value的refcount減一,而後缺其refcount的值不爲0那麼它就多是垃圾,進入垃圾週期。
二、進入垃圾池遍歷全部成員,包括其嵌套的成員,都對其作 refcount-1的操做,看外部的引用是否爲0。

那麼對於 題主的問題來講,
首先,你要想$a爲垃圾,必定要先對 unset($a)操做,那麼此時 $a的 refcount = 2
對於$a[0] refcount-1 不影響外部的$a,
$a[1] refcount-1 ,此時 $a的 refount=1
$a[2] refcount-1 ,此時 $a 的 refount=0 
模擬減結束,那麼此變量被當成垃圾回收。

參考連接:
官方文檔
盤古大叔內核剖析之GC
鳥哥的 zval 解析

相關文章
相關標籤/搜索