本文大部份內容參照 AST 的 RFC 文檔而成:https://wiki.php.net/rfc/abstract_syntax_tree,爲了易於理解從源文檔中節選部分進行介紹。php
本文並不會告訴你抽象語法樹是什麼,這須要你本身去了解,這裏只是描述 AST 給 PHP 帶來的一些變化。git
PHP7 的內核中有一個重要的變化是加入了 AST。在 PHP5中,從 php 腳本到 opcodes 的執行的過程是:github
Lexing:詞法掃描分析,將源文件轉換成 token 流;數組
Parsing:語法分析,在此階段生成 op arrays。函數
PHP7 中在語法分析階段再也不直接生成 op arrays,而是先生成 AST,因此過程多了一步:測試
Lexing:詞法掃描分析,將源文件轉換成 token 流;優化
Parsing:語法分析,從 token 流生成抽象語法樹;.net
Compilation:從抽象語法樹生成 op arrays。code
從以上的步驟來看,這比以前的過程還多了一步,因此按常理來講這反而會增長程序的執行時間和內存的使用。但事實上內存的使用確實增長了,可是執行時間上卻有所下降。orm
如下結果是使用小(代碼大約 100 行)、中(大約 700 行)、大(大約 2800 行)三個腳本分別進行測試獲得的,測試腳本: https://gist.github.com/nikic/289b0c7538b46c2220bc
每一個文件編譯 100 次的執行時間(注意文章的測試結果時間是 14 年,PHP7 還叫 PHP-NG 的時候):
php-ng | php-ast | diff | |
---|---|---|---|
SMALL | 0.180s | 0.160s | -12.5% |
MEDIUM | 1.492s | 1.268s | -17.7% |
LARGE | 6.703s | 5.736s | -16.9% |
單次編譯中的內存峯值:
php-ng | php-ast | diff | |
---|---|---|---|
SMALL | 378kB | 414kB | +9.5% |
MEDIUM | 507kB | 643kB | +26.8% |
LARGE | 1084kB | 1857kB | +71.3% |
單次編譯的測試結果可能並不能表明實際使用的狀況,如下是使用 PhpParser 進行完整項目測試獲得的結果:
php-ng | php-ast | diff | |
---|---|---|---|
TIME | 25.5ms | 22.8ms | -11.8% |
MEMORY | 2360kB | 2482kB | +5.1% |
測試代表,使用 AST 以後程序的執行時間總體上大概有 10% 到 15% 的提高,可是內存消耗也有增長,在大文件單次編譯中增長明顯,可是在整個項目執行過程當中並非很嚴重的問題。
還有注意的是以上的結果都是在沒有 Opcache 的狀況下,生產環境中打開 Opcache 的狀況下,內存的消耗增長也不是很大的問題。
若是僅僅是時間上的優化,彷佛也不是使用 AST 的充足理由。其實實現 AST 並非基於時間優化上的考慮,而是爲了解決語法上的問題。下面來看一下語義上的一些變化。
在 PHP5 的實現中,若是在一個表達式上下文(例如在一個賦值表達式的右側)中使用 yield,你必須在 yield 申明兩邊使用括號:
<?php $result = yield fn(); // 不合法的 $result = (yield fn()); // 合法的
這種行爲僅僅是由於 PHP5 的實現方式的限制,在 PHP7 中,括號再也不是必須的了。因此下面這些寫法也都是合法的:
<?php $result = yield; $result = yield $v; $result = yield $k => $v;
固然了,還得遵循 yield 的應用場景才行。
在 PHP5 中,($foo)['bar'] = 'baz'
和 $foo['bar'] = 'baz'
兩個語句的含義不同。事實上前一種寫法是不合法的,你會獲得下面這樣的錯誤:
<?php ($foo)['bar'] = 'baz'; # PHP Parse error: Syntax error, unexpected '[' on line 1
可是在 PHP7 中,兩種寫法表示一樣的意思。
一樣,若是函數的參數被括號包裹,類型檢查存在問題,在 PHP7 中這個問題也獲得瞭解決:
<?php function func() { return []; } function byRef(array &$a) { } byRef((func()));
以上代碼在 PHP5 中不會告警,除非使用 byRef(func())
的方式調用,可是在 PHP7 中,無論 func()
兩邊有沒有括號都會產生如下錯誤:
PHP Strict standards: Only variables should be passed by reference ...
list 關鍵字的行爲改變了不少。list 給變量賦值的順序(等號左右同時的順序)之前是從右至左,如今是從左到右:
<?php list($array[], $array[], $array[]) = [1, 2, 3]; var_dump($array); // PHP5: $array = [3, 2, 1] // PHP7: $array = [1, 2, 3] # 注意這裏的左右的順序指的是等號左右同時的順序, # list($a, $b) = [1, 2] 這種使用中 $a == 1, $b == 2 是沒有疑問的。
產生上面變化的緣由正是由於在 PHP5 的賦值過程當中,3
會最早被填入數組,1
最後,可是如今順序改變了。
一樣的變化還有:
<?php $a = [1, 2]; list($a, $b) = $a; // PHP5: $a = 1, $b = 2 // PHP7: $a = 1, $b = null + "Undefined index 1"
這是由於在之前的賦值過程當中 $b
先獲得 2
,而後 $a
的值才變成 1
,可是如今 $a
先變成了 1
,再也不是數組,因此 $b
就成了 null
。
list 如今只會訪問每一個偏移量一次:
<?php list(list($a, $b)) = $array; // PHP5: $b = $array[0][1]; $a = $array[0][0]; // PHP7: // 會產生一箇中間變量,獲得 $array[0] 的值 $_tmp = $array[0]; $a = $_tmp[0]; $b = $_tmp[1];
空的 list 成員如今是所有禁止的,之前只是在某些狀況下:
<?php list() = $a; // 不合法 list($b, list()) = $a; // 不合法 foreach ($a as list()) // 不合法 (PHP5 中也不合法)
引用賦值的順序在 PHP5 中是從右到左的,如今時從左到右:
<?php $obj = new stdClass; $obj->a = &$obj->b; $obj->b = 1; var_dump($obj); // PHP5: object(stdClass)#1 (2) { ["b"] => &int(1) ["a"] => &int(1) } // PHP7: object(stdClass)#1 (2) { ["a"] => &int(1) ["b"] => &int(1) }
如今能夠直接使用 $obj->__clone()
的寫法去調用 __clone
方法。__clone
是以前惟一一個被禁止直接調用的魔術方法,以前你會獲得一個這樣的錯誤:
Fatal error: Cannot call __clone() method on objects - use 'clone $obj' instead in ...
AST 也解決了一些語法一致性的問題,這些問題是在另一個 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.
在新的實現上,之前的一些語法表達的含義和如今有些不一樣,具體的能夠參照下面的表格:
Expression | PHP5 | PHP7 |
---|---|---|
$$foo['bar']['baz'] |
${$foo['bar']['baz']} |
($$foo)['bar']['baz'] |
$foo->$bar['baz'] |
$foo->{$bar['baz']} |
($foo->$bar)['baz'] |
$foo->$bar['baz']() |
$foo->{$bar['baz']}() |
($foo->$bar)['baz']() |
Foo::$bar['baz']() |
Foo::{$bar['baz']}() |
(Foo::$bar)['baz']() |
總體上仍是之前的順序是從右到左,如今從左到右,同時也遵循括號不影響行爲的原則。這些複雜的變量寫法是在實際開發中須要注意的。
私博地址:http://0x1.im