PHP之引用計數內存管理機制和垃圾回收機制

引用賦值

$a = 'apple';
$b = &$a;

上述代碼中,我將一個字符串賦值給變量a,而後將a的引用賦值給了變量b。顯然,這個時候的內存指向應該是這樣的:php

$a -> 'apple' <- $b

a和b指向了同一塊內存區域(變量容器 zval ),咱們經過 var_dump($a, $b) 獲得 string(5) "apple" string(5) "apple" ,這是咱們預期的結果。html

unset函數 與 引用計數

unset 函數

假如我想將 'apple' 這個字符串從內存中釋放掉。我是這麼作的:web

unset($a);

可是經過再次打印 $a $b 兩變量的信息,我獲得了這樣的結果:Notice: Undefined variable: astring(5) "apple" 。奇怪,$a $b 指向同一個變量容器,又明明將$a釋放了,爲何$b仍是'apple'算法

實際上是這樣的,unset()只是將一個變量符號a(指針)銷燬了,並無釋放掉那個變量容器,因此執行完操做以後,內存指向只是變成了這樣:segmentfault

'apple' <- $b

引用計數

引用計數 (reference count)是每一個變量容器中都會存放的一條信息,它表示當前變量容器正被多少個變量符號所引用。數組

正如以前的例子,unset()並無釋放變量所指向的變量容器,而只是將變量符號銷燬了。同時,將變量容器中的 引用計數 減1,當引用計數爲0時,也就是說當變量容器不被任何變量引用時,便會觸發php的垃圾回收(錯誤) ,它便會被釋放(正確)。swoole

更正上述的一個小錯誤: 這種單純的引用計數方式是 php 5.2 以前的內存管理機制,稱不上是垃圾回收機制,垃圾回收機制是 php 5.3 才引入的,垃圾回收機制爲的是解決這種單純的引用計數內存管理機制的缺陷(即 循環引用致使的內存泄漏,下文會進行講解)app

回到正題,咱們用代碼來驗證一下先前的結論:函數

$a = 'apple';
$b = &$a;

$before = memory_get_usage();
unset($a);
$after = memory_get_usage();

var_dump($before - $after);  // 結果爲int(0),變量容器的引用計數爲1,沒有釋放
$a = 'apple';
$b = &$a;

$before = memory_get_usage();
unset($a, $b);
$after = memory_get_usage();

var_dump($before - $after);  // 結果爲int(24),變量容器的引用計數爲0,獲得釋放

直接釋放

那要怎樣作才能真正釋放掉 'apple' 所佔用的內存呢?spa

利用上述方法,咱們能夠在 unset($a) 以後再 unset($b) ,將變量容器的全部引用都銷燬,引用計數減爲0了,天然就被釋放掉了。

固然,還有更直接的方法:

$a = null;

直接賦值 null 會將 $a 所指向的內存區域置空,並將引用計數歸零,內存便被釋放。

腳本執行結束後的內存

對於通常的web程序來講(fpm模式下),php的執行是單線程同步阻塞型的,當腳本執行結束以後,腳本內使用的全部內存都會被釋放。那麼,咱們手動去釋放內存到底有意義嗎?

其實關於這個問題,早有解答,推薦你們看一下鳥哥 @laruence 2012年發表的一篇文章:

請手動釋放你的資源(Please release resources manually)

引用計數內存管理機制的缺陷:循環引用

如今咱們來說講以前提到的引用計數內存管理機制的缺陷。

當一個變量容器的引用計數爲0時,php會進行垃圾回收。可是,你可想過,有一種狀況會致使一個變量容器的引用計數永遠不會被減爲0,舉個例子:

$a = ['one'];
$a[] = &$a;

咱們看到,$a數組第二個元素就是它自己。那麼,存放數組的這個變量容器的引用計數爲2,一個引用是變量a,另外一個引用是這個數組的第二個元素 - 索引1

圖片描述

那麼,若是這時咱們 unset($a) ,存放數組的變量容器的引用計數會減1,但還有1個引用,就是數組的元素 1 ,如今引用結構變成了這樣:

圖片描述

因爲變量容器的引用計數沒有變爲0,因此不能被釋放,並且這時又沒有外部其餘變量符號引用它,用戶也沒有辦法去清除這個結構,這時它就會一直駐留在內存之中。

因此若是代碼中存在大量的這種結構和操做,最終會致使內存損耗甚至泄漏。這就是 循環引用 帶來的內存沒法釋放的問題。

慶幸的是,fpm模式下,當請求的腳本執行結束,php會釋放全部腳本中使用到的內存,包括這個結構。可是,若是是守護進程下的php程序呢?好比swoole。這個php須要解決的急迫問題(已經解決,見下文)。

PHP 5.3.0 引入的同步算法

傳統上,像之前的 php 用到的引用計數內存機制,沒法處理循環引用的內存泄漏。然而 5.3.0 PHP 使用文章 » 引用計數系統中的同步週期回收(Concurrent Cycle Collection in Reference Counted Systems) 中的同步算法,解決了這個內存泄漏問題,這種算法就是PHP的垃圾回收機制。

具體算法的實現和流程有些許複雜,請閱讀官方文檔,這裏再也不贅述,另附上幾個算法流程講解的文章連接,講得比較直白:

http://php.net/manual/zh/feat... 官方文檔
http://www.cnblogs.com/leoo2s...
https://blog.csdn.net/phpkern...

最後,仍是引用鳥哥文章的這兩段來講明問題:

在PHP5.2之前, PHP使用引用計數(Reference count)來作資源管理, 當一個zval的引用計數爲0的時候, 它就會被釋放. 雖然存在循環引用(Cycle reference), 但這樣的設計對於開發Web腳原本說, 沒什麼問題, 由於Web腳本的特色和它追求的目標就是執行時間短, 不會長期運行. 對於循環引用形成的資源泄露, 會在請求結束時釋放掉. 也就是說, 請求結束時釋放資源, 是一種補救措施(backup).

然而, 隨着PHP被愈來愈多的人使用, 就有不少人在一些後臺腳本使用PHP, 這些腳本的特色是長期運行, 若是存在循環引用, 致使引用計數沒法及時釋放不用的資源, 則這個腳本最終會內存耗盡退出.

因此在PHP5.3之後, 咱們引入了GC, 也就是說, 咱們引入GC是爲了解決用戶沒法解決的問題.

相關文章
相關標籤/搜索