深刻理解 PHP7 中全新的 zval 容器和引用計數機制

前言

最近在查閱 PHP7 垃圾回收的資料的時候,網上的一些代碼示例在本地環境下運行時出現了不一樣的結果,使我一度很是迷惑。 仔細一想不難發現問題所在:這些文章大可能是 PHP5.x 時代的,而 PHP7 發佈後,採用了新的 zval 結構,相關的資料也比較貧瘠,因此我結合一些資料作了一個總結,主要側重於解釋新 zval 容器中的引用計數機制,若有謬誤,還望不吝指教。node

PHP7 中新的 zval 結構

明人不說暗話,先看代碼!數組

struct _zval_struct {
    union {
        zend_long         lval;             /* long value */
        double            dval;             /* double value */
        zend_refcounted  *counted;
        zend_string      *str;
        zend_array       *arr;
        zend_object      *obj;
        zend_resource    *res;
        zend_reference   *ref;
        zend_ast_ref     *ast;
        zval             *zv;
        void             *ptr;
        zend_class_entry *ce;
        zend_function    *func;
        struct {
            uint32_t w1;
            uint32_t w2;
        } ww;
    } value;
    union {
        struct {
            ZEND_ENDIAN_LOHI_4(
                zend_uchar    type,         /* active type */
                zend_uchar    type_flags,
                zend_uchar    const_flags,
                zend_uchar    reserved)     /* call info for EX(This) */
        } v;
        uint32_t type_info;
    } u1;
    union {
        uint32_t     var_flags;
        uint32_t     next;                 /* hash collision chain */
        uint32_t     cache_slot;           /* literal cache slot */
        uint32_t     lineno;               /* line number (for ast nodes) */
        uint32_t     num_args;             /* arguments number for EX(This) */
        uint32_t     fe_pos;               /* foreach position */
        uint32_t     fe_iter_idx;          /* foreach iterator index */
    } u2;
};
複製代碼

對於該結構的詳細描述能夠參考文末鳥哥的文章,寫的很是詳細,我就不關公面前耍大刀了,這裏我只提出幾個比較關鍵的點:數據結構

  1. PHP7 中的變量分爲變量名變量值兩部分,分別對應 zval_struct 和在其中聲明的 value
  2. zval_struct.value 中的 zend_longdouble 都是簡單數據類型,可以直接儲存具體的值,而其餘複雜數據類型儲存一個指向其餘數據結構的指針
  3. PHP7 中,引用計數器儲存在 value 中而不是 zval_struct
  4. NULL布爾型都屬於沒有值的數據類型(其中布爾型經過 IS_FALSEIS_TRUE 兩個常量來標記),天然也就沒有引用計數
  5. 引用(REFERENCE)變爲了一種數據結構而再也不只是一個標記位了,它的結構以下:
struct _zend_reference {
    zend_refcounted_h gc;
    zval              val;
}
複製代碼
  1. zend_reference 做爲 zval_struct 中包含的一種 value 類型,也擁有本身的 val 值,這個值是指向一個 zval_struct.value 的。他們都擁有本身的引用計數器
引用計數器用來記錄當前有多少 zval 指向同一個 zend_value

針對第六點,請看以下代碼:函數

$a = 'foo';
$b = &$a;
$c = $a;
複製代碼

此時的數據結構是這樣的:優化

$a 與 $b 各擁有一個 zval_struct 容器,而且其中的 value 都指向同一個 zend_reference 結構,zend_reference 內嵌一個 val 結構, 指向同一個 zend_string字符串的內容就儲存在其中。ui

而 $c 也擁有一個 zval_struct,而它的 value 在初始化的時候能夠直接指向上面提到的 zend_string ,這樣在拷貝時就不會產生複製。debug

下面咱們就聊一聊在這種全新的 zval 結構中,會出現的種種現象,和這些現象背後的緣由。指針

問題

一. 爲何某些變量的引用計數器的初始值爲 0

現象

$var_int = 233;
$var_float = 233.3;
$var_str = '233';

xdebug_debug_zval('var_int');
xdebug_debug_zval('var_float');
xdebug_debug_zval('var_str');

/** 輸出 **
var_int:
(refcount=0, is_ref=0)int 233

var_float:
(refcount=0, is_ref=0)float 233.3

var_str:
(refcount=0, is_ref=0)string '233' (length=3)
**********/
複製代碼

緣由

在 PHP7 中,爲一個變量賦值的時候,包含了兩部分操做:code

  1. 爲符號量(即變量名)申請一個 zval_struct 結構
  2. 將變量的值儲存到 zval_struct.value 中 對於 zvalvalue 字段中能保存下的值,就不會在對他們進行引用計數,而是在拷貝的時候直接賦值,這部分類型有:
  • IS_LONG
  • IS_DOUBLE

即咱們在 PHP 中的整形浮點型對象

那麼 var_str 的 refcount 爲何也是 0 呢?
這就牽扯到 PHP 中字符串的兩種類型:

  1. interned string 內部字符串(函數名、類名、變量名、靜態字符串):
$str = '233';    // 靜態字符串
複製代碼
  1. 普通字符串:
$str = '233' . time(); 
複製代碼

對於內部字符串而言,字符串的內容是惟一不變的,至關於 C 語言中定義在靜態變量區的字符串,他們的生存週期存在於整個請求期間,request 完成後會統一銷燬釋放,天然也就無需經過引用計數進行內存管理。

二. 爲何在對整形、浮點型和靜態字符串型變量進行引用賦值時,計數器的值會直接變爲2

現象

$var_int_1 = 233;
$var_int_2 = &var_int;
xdebug_debug_zval('var_int_1');

/** 輸出 **
var_int:
(refcount=2, is_ref=1)int 233
**********/
複製代碼

緣由

回憶一下咱們開頭講的 zval_structvalue 的數據結構,當爲一個變量賦整形浮點型靜態字符串類型的值時,value 的數據類型爲 zend_longdoublezend_string,這時值是能夠直接儲存在 value 中的。而按值拷貝時,會開闢一個新的 zval_struct 以一樣的方式將值儲存到相同數據類型的 value 中,因此 refcount 的值一直都會爲 0。

可是當使用 & 操做符進行引用拷貝時,狀況就不同了:

  1. PHP 爲 & 操做符操做的變量申請一個 zend_reference 結構
  2. zend_reference.value 指向原來的 zval_struct.value
  3. zval_struct.value 的數據類型會被修改成 zend_refrence
  4. zval_struct.value 指向剛剛申請並初始化後的 zend_reference
  5. 爲新變量申請 zval_struct 結構,將他的 value 指向剛剛建立的 zend_reference

此時:$var\_int\_1 和 $var_int_2 都擁有一個 zval_struct 結構體,而且他們的 zval_struct.value 都指向了同一個 zend_reference 結構,因此該結構的引用計數器的值爲 2。

題外話:zend_reference 又指向了一個整形或浮點型的 value,若是指向的 value 類型是 zend_string,那麼該 value 引用計數器的值爲 1。而 xdebug 出來的 refcount 顯示的是 zend_reference 的計數器值(即 2)

三. 爲何初始數組的引用計數器的值爲 2

現象

$var_empty_arr = [1, 2, '3'];
xdebug_debug_zval('var_empty_arr');

/** 輸出 **
var_arr:
(refcount=2, is_ref=0)
array (size=3)
  0 => (refcount=0, is_ref=0)int 1
  1 => (refcount=0, is_ref=0)int 2
  2 => (refcount=1, is_ref=0)string '3' (length=1)
**********/
複製代碼

緣由

這牽扯到 PHP7 中的另外一個概念,叫作 immutable array(不可變數組)。

For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.

不可變數組opcache 擴展優化出的一種數組類型,簡單的說,全部屢次編譯結果恆定不變的數組,都會被優化爲不可變數組,下面是一個反例:

$array = [1, 2, time()];
複製代碼

PHP 在編譯階段沒法得知 time() 函數的返回值,因此此處的 $array 是可變數組

不可變數組和咱們上面講到的內部字符串同樣,都是不使用引用計數的,可是不一樣點是,內部字符串的計數值恆爲 0,而不可變數組會使用一個僞計數值 2。

總結

  • 簡單數據類型

    • 整形(不使用引用計數)
    • 浮點型(不使用引用計數)
    • 布爾型(不使用引用計數)
    • NULL(不使用引用計數)
  • 複雜數據類型

    • 字符串

      • 普通字符串(使用引用計數,初始值爲 1)
      • 內部字符串(不使用引用計數,引用計數值恆爲 0)
    • 數組

      • 普通數組(使用引用計數,初始值爲 1)
      • 不可變數組(不使用引用計數,使用僞計數值 2)
    • 對象(使用引用計數,初始值爲 1)
相關文章
相關標籤/搜索