PHP7 的抽象語法樹(AST)帶來的變化

本文大部份內容參照 AST 的 RFC 文檔而成:https://wiki.php.net/rfc/abstract_syntax_tree,爲了易於理解從源文檔中節選部分進行介紹。php

本文並不會告訴你抽象語法樹是什麼,這須要你本身去了解,這裏只是描述 AST 給 PHP 帶來的一些變化。git

新的執行過程

PHP7 的內核中有一個重要的變化是加入了 AST。在 PHP5中,從 php 腳本到 opcodes 的執行的過程是:github

  1. Lexing:詞法掃描分析,將源文件轉換成 token 流;數組

  2. Parsing:語法分析,在此階段生成 op arrays。函數

PHP7 中在語法分析階段再也不直接生成 op arrays,而是先生成 AST,因此過程多了一步:測試

  1. Lexing:詞法掃描分析,將源文件轉換成 token 流;優化

  2. Parsing:語法分析,從 token 流生成抽象語法樹;.net

  3. Compilation:從抽象語法樹生成 op arrays。code

執行時間和內存消耗

從以上的步驟來看,這比以前的過程還多了一步,因此按常理來講這反而會增長程序的執行時間和內存的使用。但事實上內存的使用確實增長了,可是執行時間上卻有所下降。orm

如下結果是使用小(代碼大約 100 行)、中(大約 700 行)、大(大約 2800 行)三個腳本分別進行測試獲得的,測試腳本: https://gist.github.com/nikic/289b0c7538b46c2220bc

每一個文件編譯 100 次的執行時間(注意文章的測試結果時間是 14 年,PHP7 還叫 PHP-NG 的時候):

php-ng php-ast diff
SMALL 0.180s 0.160s -12.5%
MEDIUM 1.492s 1.268s -17.7%
LARGE 6.703s 5.736s -16.9%

單次編譯中的內存峯值:

php-ng php-ast diff
SMALL 378kB 414kB +9.5%
MEDIUM 507kB 643kB +26.8%
LARGE 1084kB 1857kB +71.3%

單次編譯的測試結果可能並不能表明實際使用的狀況,如下是使用 PhpParser 進行完整項目測試獲得的結果:

php-ng php-ast diff
TIME 25.5ms 22.8ms -11.8%
MEMORY 2360kB 2482kB +5.1%

測試代表,使用 AST 以後程序的執行時間總體上大概有 10% 到 15% 的提高,可是內存消耗也有增長,在大文件單次編譯中增長明顯,可是在整個項目執行過程當中並非很嚴重的問題。

還有注意的是以上的結果都是在沒有 Opcache 的狀況下,生產環境中打開 Opcache 的狀況下,內存的消耗增長也不是很大的問題。

語義上的改變

若是僅僅是時間上的優化,彷佛也不是使用 AST 的充足理由。其實實現 AST 並非基於時間優化上的考慮,而是爲了解決語法上的問題。下面來看一下語義上的一些變化。

yield 不須要括號

在 PHP5 的實現中,若是在一個表達式上下文(例如在一個賦值表達式的右側)中使用 yield,你必須在 yield 申明兩邊使用括號:

<?php
$result = yield fn();   // 不合法的
$result = (yield fn()); // 合法的

這種行爲僅僅是由於 PHP5 的實現方式的限制,在 PHP7 中,括號再也不是必須的了。因此下面這些寫法也都是合法的:

<?php
$result = yield;
$result = yield $v;
$result = yield $k => $v;

固然了,還得遵循 yield 的應用場景才行。

括號不影響行爲

在 PHP5 中,($foo)['bar'] = 'baz' 和 $foo['bar'] = 'baz' 兩個語句的含義不同。事實上前一種寫法是不合法的,你會獲得下面這樣的錯誤:

<?php
($foo)['bar'] = 'baz';
# PHP Parse error: Syntax error, unexpected '[' on line 1

可是在 PHP7 中,兩種寫法表示一樣的意思。

一樣,若是函數的參數被括號包裹,類型檢查存在問題,在 PHP7 中這個問題也獲得瞭解決:

<?php
function func() {
    return [];
}

function byRef(array &$a) {
}

byRef((func()));

以上代碼在 PHP5 中不會告警,除非使用 byRef(func()) 的方式調用,可是在 PHP7 中,無論 func() 兩邊有沒有括號都會產生如下錯誤:

PHP Strict standards:  Only variables should be passed by reference ...

list() 的變化

list 關鍵字的行爲改變了不少。list 給變量賦值的順序(等號左右同時的順序)之前是從右至左,如今是從左到右:

<?php
list($array[], $array[], $array[]) = [1, 2, 3];
var_dump($array);

// PHP5: $array = [3, 2, 1]
// PHP7: $array = [1, 2, 3]

# 注意這裏的左右的順序指的是等號左右同時的順序,
# list($a, $b) = [1, 2] 這種使用中 $a == 1, $b == 2 是沒有疑問的。

產生上面變化的緣由正是由於在 PHP5 的賦值過程當中,3 會最早被填入數組,1 最後,可是如今順序改變了。

一樣的變化還有:

<?php
$a = [1, 2];
list($a, $b) = $a;

// PHP5: $a = 1, $b = 2
// PHP7: $a = 1, $b = null + "Undefined index 1"

這是由於在之前的賦值過程當中 $b 先獲得 2,而後 $a 的值才變成 1,可是如今 $a 先變成了 1,再也不是數組,因此 $b 就成了 null

list 如今只會訪問每一個偏移量一次:

<?php
list(list($a, $b)) = $array;

// PHP5:
$b = $array[0][1];
$a = $array[0][0];

// PHP7:
// 會產生一箇中間變量,獲得 $array[0] 的值
$_tmp = $array[0];
$a = $_tmp[0];
$b = $_tmp[1];

空的 list 成員如今是所有禁止的,之前只是在某些狀況下:

<?php
list() = $a;           // 不合法
list($b, list()) = $a; // 不合法
foreach ($a as list()) // 不合法 (PHP5 中也不合法)

引用賦值的順序

引用賦值的順序在 PHP5 中是從右到左的,如今時從左到右:

<?php
$obj = new stdClass;
$obj->a = &$obj->b;
$obj->b = 1;
var_dump($obj);

// PHP5:
object(stdClass)#1 (2) {
  ["b"] => &int(1)
  ["a"] => &int(1)
}

// PHP7:
object(stdClass)#1 (2) {
  ["a"] => &int(1)
  ["b"] => &int(1)
}

__clone 方法能夠直接調用

如今能夠直接使用 $obj->__clone() 的寫法去調用 __clone 方法。__clone 是以前惟一一個被禁止直接調用的魔術方法,以前你會獲得一個這樣的錯誤:

Fatal error: Cannot call __clone() method on objects - use 'clone $obj' instead in ...

變量語法一致性

AST 也解決了一些語法一致性的問題,這些問題是在另一個 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.

在新的實現上,之前的一些語法表達的含義和如今有些不一樣,具體的能夠參照下面的表格:

Expression PHP5 PHP7
$$foo['bar']['baz'] ${$foo['bar']['baz']} ($$foo)['bar']['baz']
$foo->$bar['baz'] $foo->{$bar['baz']} ($foo->$bar)['baz']
$foo->$bar['baz']() $foo->{$bar['baz']}() ($foo->$bar)['baz']()
Foo::$bar['baz']() Foo::{$bar['baz']}() (Foo::$bar)['baz']()

總體上仍是之前的順序是從右到左,如今從左到右,同時也遵循括號不影響行爲的原則。這些複雜的變量寫法是在實際開發中須要注意的。

私博地址:http://0x1.im

相關文章
相關標籤/搜索