PHP內核中是如何實現 empty, isset 這些函數的?

$TOC$php

叨叨幾句

原本這個問題是在oschina上提出的:
http://www.oschina.net/question/1179015_2140695node

但一直沒收到合適的答案,因此仍是本身下功夫梳理了一下,若是有錯誤的地方,歡迎交流。git

一般的函數是經過ZEND_FUNCTION(xxx) 這種宏定義來實現的,這個規範很好理解,也很容易讀懂源碼。vim

但empty(), isset()的處理比較特殊,相似的還有echo, eval等。函數

準備工做

用於查看PHP opcode的擴展vld,下載:
http://pecl.php.net/package/vld源碼分析

PHP源碼,分支 => remotes/origin/PHP-5.6.14性能

git clone http://git.php.net/repository/php-src.git -b PHP-5.6.14

PHP opcode對應參考:
http://php.net/manual/en/internals2.opcodes.phpfetch

PHP執行程序版本爲 5.6.14 ,其餘版本opcode可能會有細微差異。.net

PHP 內核源碼分析:
http://www.php-internals.com/book/code

開始分析

示例代碼 vld.php :

<?php
	$a = 0;
	empty($a);
	isset($a);

經過vld 查看opcode ,php -d vld.active=1 vld.php

number of ops:  10
compiled vars:  !0 = $a
line     #* E I O op                           fetch          ext  return  operands
-------------------------------------------------------------------------------------
   2     0  E >   EXT_STMT
		 1        ASSIGN                                                   !0, 0
   3     2        EXT_STMT
		 3        ISSET_ISEMPTY_VAR                           293601280  ~1      !0
		 4        FREE                                                     ~1
   4     5        EXT_STMT
		 6        ISSET_ISEMPTY_VAR                           310378496  ~2      !0
		 7        FREE                                                     ~2
   6     8        EXT_STMT
		 9      > RETURN                                                   1

branch: #  0; line:     2-    6; sop:     0; eop:     9; out1:  -2

opcode中都出現了ZEND_ISSET_ISEMPTY_VAR,咱們一步步分析。

當執行PHP源碼,會先進行語法分析,empty, isset的yacc以下:

vim Zend/zend_language_parser.y +1265

1265 internal_functions_in_yacc:
1266 ›   ›   T_ISSET '(' isset_variables ')' { $$ = $3; }
1267 ›   |›  T_EMPTY '(' variable ')'›   { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }
1275
1276 isset_variables:
1277 ›   ›   isset_variable› ›   ›   { $$ = $1; }
1280
1281 isset_variable:
1282 ›   ›   variable›   ›   ›   ›   { zend_do_isset_or_isempty(ZEND_ISSET, &$$, &$1 TSRMLS_CC); }

最終都執行了zend_do_isset_or_isempty,繼續查找:

git grep -in "zend_do_isset_or_isempty"
Zend/zend_compile.c:6287:void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {:{:{ */

vi Zend/zend_compile.c +6287

6287 void zend_do_isset_or_isempty(int type, znode *result, znode *variable TSRMLS_DC) /* {{{ */
6288 {
6289 ›   zend_op *last_op;
6290
6291 ›   zend_do_end_variable_parse(variable, BP_VAR_IS, 0 TSRMLS_CC);
6292
6293 ›   if (zend_is_function_or_method_call(variable)) {
6294 ›   ›   if (type == ZEND_ISEMPTY) {
6295 ›   ›   ›   /* empty(func()) can be transformed to !func() */
6296 ›   ›   ›   zend_do_unary_op(ZEND_BOOL_NOT, result, variable TSRMLS_CC);
6297 ›   ›   } else {
6298 ›   ›   ›   zend_error_noreturn(E_COMPILE_ERROR, "Cannot use isset() on the result of a function call (you can use \"null !== func()\" instead)");
6299 ›   ›   }
6300
6301 ›   ›   return;
6302 ›   }
6303
6304 ›   if (variable->op_type == IS_CV) {
6305 ›   ›   last_op = get_next_op(CG(active_op_array) TSRMLS_CC);
6306 ›   ›   last_op->opcode = ZEND_ISSET_ISEMPTY_VAR;

最後一行 6306,ZEND_ISSET_ISEMPTY_VAR 這個opcode 出來了,IS_CV 判斷參數是否爲變量。 注意zend_is_function_or_method_call(variable),當isset(fun($a)),函數參數寫法會報錯,empty在5.5版本開始支持函數參數,低版本不支持。

opcode 是由 zend_execute 執行的,最終會對應處理函數的查找,這個是核心,請參閱:
http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler

opcode 對應處理函數的命名規律:

ZEND_[opcode]_SPEC_(變量類型1)_(變量類型2)_HANDLER

變量類型1和變量類型2是可選的,若是同時存在,那就是左值和右值,概括有下幾類: VAR TMP CV UNUSED CONST 這樣能夠根據相關的執行場景來斷定。

因此 ZEND_ISSET_ISEMPTY_VAR 對應的handler以下:

Zend/zend_vm_execute.h:44233:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_CONST_HANDLER,
Zend/zend_vm_execute.h:44235:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_VAR_HANDLER,
Zend/zend_vm_execute.h:44236:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CONST_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44238:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_CONST_HANDLER,
Zend/zend_vm_execute.h:44240:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_VAR_HANDLER,
Zend/zend_vm_execute.h:44241:   ZEND_ISSET_ISEMPTY_VAR_SPEC_TMP_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44243:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_CONST_HANDLER,
Zend/zend_vm_execute.h:44245:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_VAR_HANDLER,
Zend/zend_vm_execute.h:44246:   ZEND_ISSET_ISEMPTY_VAR_SPEC_VAR_UNUSED_HANDLER,
Zend/zend_vm_execute.h:44253:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_CONST_HANDLER,
Zend/zend_vm_execute.h:44255:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER,
Zend/zend_vm_execute.h:44256:   ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_UNUSED_HANDLER,

咱們看下 ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER 這個處理函數: vim Zend/zend_vm_execute.h +37946

38013 ›   if (opline->extended_value & ZEND_ISSET) {
38014 ›   ›   if (isset && Z_TYPE_PP(value) != IS_NULL) {
38015 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38016 ›   ›   } else {
38017 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38018 ›   ›   }
38019 ›   } else /* if (opline->extended_value & ZEND_ISEMPTY) */ {
38020 ›   ›   if (!isset || !i_zend_is_true(*value)) {
38021 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
38022 ›   ›   } else {
38023 ›   ›   ›   ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
38024 ›   ›   }

上面的 if ... else 就是判斷是isset,仍是empty,而後作不一樣處理,Z_TYPE_PP, i_zend_is_true 不一樣判斷。 echo 等處理相似,本身按照流程具體去分析。關鍵是根據映射表找到對應的handler處理函數。

瞭解這些處理流程後,相信會對PHP語句的性能分析更熟悉。

相關文章
相關標籤/搜索