PHP是解析型高級語言,事實上從Zend內核的角度來看PHP就是一個普通的C程序,它有main函數,咱們寫的PHP代碼是這個程序的輸入,而後通過內核的處理輸出結果,內核將PHP代碼"翻譯"爲C程序可識別的過程就是PHP的編譯。node
C程序在編譯時將一行行代碼編譯爲機器碼,每個操做都認爲是一條機器指令,這些指令寫入到編譯後的二進制程序中,執行的時候將二進制程序load進相應的內存區域(常量區、數據區、代碼區)、分配運行棧,而後從代碼區起始位置開始執行,這是C程序編譯、執行的簡單過程。數組
一樣,PHP的編譯與普通的C程序相似,只是PHP代碼沒有編譯成機器碼,而是解析成了若干條opcode數組,每條opcode就是C裏面普通的struct,含義對應C程序的機器指令,執行的過程就是引擎依次執行opcode,好比咱們在PHP裏定義一個變量:$a = 123;
,最終到內核裏執行就是malloc一塊內存,而後把值寫進去。緩存
在zend_compile.h文件中,opcode結構:函數
1 struct _zend_op { 2 const void *handler; //對應執行的C語言function,即每條opcode都有一個C function處理 3 znode_op op1; //操做數1 4 znode_op op2; //操做數2 5 znode_op result; //返回值 6 uint32_t extended_value; 7 uint32_t lineno; 8 zend_uchar opcode; //opcode指令 9 zend_uchar op1_type; //操做數1類型 10 zend_uchar op2_type; //操做數2類型 11 zend_uchar result_type; //返回值類型 12 };
因此PHP的解析過程任務就是將PHP代碼(經過詞法分析re2c,語法分析bison)轉化爲opcode數組,代碼裏的全部信息都保存在opcode中,而後將opcode數組交給zend引擎執行,opcode就是內核具體執行的命令,好比賦值、加減操做、函數調用等,每一條opcode都對應一個處理handle,這些handler是提早定義好的C函數。ui
1 struct _zend_op_array { 2 //common是普通函數或類成員方法對應的opcodes快速訪問時使用的字段 3 /* Common elements */ 4 zend_uchar type; 5 zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */ 6 uint32_t fn_flags; 7 zend_string *function_name; 8 zend_class_entry *scope; 9 zend_function *prototype; 10 uint32_t num_args; 11 uint32_t required_num_args; 12 zend_arg_info *arg_info; 13 /* END of common elements */ 14 15 uint32_t *refcount; 16 17 uint32_t last; 18 //opcode指令數組 19 zend_op *opcodes; 20 21 //PHP代碼裏定義的變量數:op_type爲IS_CV的變量,不含IS_TMP_VAR、IS_VAR的 22 //編譯前此值爲0,而後發現一個新變量這個值就加1 23 int last_var; 24 //臨時變量數:op_type爲IS_TMP_VAR、IS_VAR的變量 25 uint32_t T; 26 //PHP變量名數組 27 zend_string **vars;//這個數組在ast編譯期間配合last_var用來肯定各個變量的編號,很是重要的一步操做 28 29 int last_live_range; 30 int last_try_catch; 31 zend_live_range *live_range; 32 zend_try_catch_element *try_catch_array; 33 34 //靜態變量符號表:經過static聲明的 35 /* static variables support */ 36 HashTable *static_variables; 37 38 zend_string *filename; 39 uint32_t line_start; 40 uint32_t line_end; 41 zend_string *doc_comment; 42 uint32_t early_binding; /* the linked list of delayed declarations */ 43 44 //字面量數量 45 int last_literal; 46 //字面量(常量)數組,這些都是在PHP代碼定義的一些值 47 zval *literals; 48 49 //運行時緩存數組大小 50 int cache_size; 51 //運行時緩存,主要用於緩存一些znode_op以便於快速獲取數據,後面單獨介紹這個機制 52 void **run_time_cache; 53 54 void *reserved[ZEND_MAX_RESERVED_RESOURCES]; 55 };
opcode指令:即PHP代碼具體對應的處理動做,與二進制程序中的代碼段對應
字面量存儲:PHP代碼中定義的一些變量初始值、調用的函數名稱、類名稱、常量名稱等等稱之爲字面量,這些值用於執行時初始化變量、函數調用等等
變量分配狀況:與字面量相似,這裏指的是當前opcodes定義了多少變量、臨時變量,每一個變量都有一個對應的編號,執行初始化按照總的數目一次性分配zval,使用時也徹底按照編號索引,而不是根據變量名索引spa
從PHP代碼到opcode是怎麼實現的?最容易想到的方式就是正則匹配,固然過程沒有這麼簡單。PHP編譯過程包括詞法分析、語法分析,使用re2c、bison完成,舊的PHP版本直接生成了opcode,PHP7新增了抽象語法樹(AST),在語法分析階段生成AST,而後再生成opcode數組prototype