php 代碼的編譯

PHP是解析型高級語言,事實上從Zend內核的角度來看PHP就是一個普通的C程序,它有main函數,咱們寫的PHP代碼是這個程序的輸入,而後通過內核的處理輸出結果,內核將PHP代碼"翻譯"爲C程序可識別的過程就是PHP的編譯。node

C程序在編譯時將一行行代碼編譯爲機器碼,每個操做都認爲是一條機器指令,這些指令寫入到編譯後的二進制程序中,執行的時候將二進制程序load進相應的內存區域(常量區、數據區、代碼區)、分配運行棧,而後從代碼區起始位置開始執行,這是C程序編譯、執行的簡單過程。數組

一樣,PHP的編譯與普通的C程序相似,只是PHP代碼沒有編譯成機器碼,而是解析成了若干條opcode數組,每條opcode就是C裏面普通的struct,含義對應C程序的機器指令,執行的過程就是引擎依次執行opcode,好比咱們在PHP裏定義一個變量:$a = 123;,最終到內核裏執行就是malloc一塊內存,而後把值寫進去。緩存

在zend_compile.h文件中,opcode結構:函數

 1 struct _zend_op {
 2     const void *handler; //對應執行的C語言function,即每條opcode都有一個C function處理
 3     znode_op op1; //操做數1
 4     znode_op op2; //操做數2
 5     znode_op result; //返回值
 6     uint32_t extended_value; 
 7     uint32_t lineno;
 8     zend_uchar opcode;  //opcode指令
 9     zend_uchar op1_type; //操做數1類型
10     zend_uchar op2_type; //操做數2類型
11     zend_uchar result_type; //返回值類型
12 };


因此PHP的解析過程任務就是將PHP代碼(經過詞法分析re2c,語法分析bison)轉化爲opcode數組,代碼裏的全部信息都保存在opcode中,而後將opcode數組交給zend引擎執行,opcode就是內核具體執行的命令,好比賦值、加減操做、函數調用等,每一條opcode都對應一個處理handle,這些handler是提早定義好的C函數。ui

 1 struct _zend_op_array {
 2     //common是普通函數或類成員方法對應的opcodes快速訪問時使用的字段
 3     /* Common elements */
 4     zend_uchar type;
 5     zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */
 6     uint32_t fn_flags;
 7     zend_string *function_name;
 8     zend_class_entry *scope;
 9     zend_function *prototype;
10     uint32_t num_args;
11     uint32_t required_num_args;
12     zend_arg_info *arg_info;
13     /* END of common elements */
14 
15     uint32_t *refcount;
16 
17     uint32_t last;
18      //opcode指令數組
19     zend_op *opcodes;
20 
21     //PHP代碼裏定義的變量數:op_type爲IS_CV的變量,不含IS_TMP_VAR、IS_VAR的
22     //編譯前此值爲0,而後發現一個新變量這個值就加1
23     int last_var;
24     //臨時變量數:op_type爲IS_TMP_VAR、IS_VAR的變量
25     uint32_t T;
26     //PHP變量名數組
27     zend_string **vars;//這個數組在ast編譯期間配合last_var用來肯定各個變量的編號,很是重要的一步操做
28 
29     int last_live_range;
30     int last_try_catch;
31     zend_live_range *live_range;
32     zend_try_catch_element *try_catch_array;
33 
34     //靜態變量符號表:經過static聲明的
35     /* static variables support */
36     HashTable *static_variables;
37 
38     zend_string *filename;
39     uint32_t line_start;
40     uint32_t line_end;
41     zend_string *doc_comment;
42     uint32_t early_binding; /* the linked list of delayed declarations */
43 
44     //字面量數量
45     int last_literal;
46     //字面量(常量)數組,這些都是在PHP代碼定義的一些值
47     zval *literals;
48 
49     //運行時緩存數組大小
50     int  cache_size;
51     //運行時緩存,主要用於緩存一些znode_op以便於快速獲取數據,後面單獨介紹這個機制
52     void **run_time_cache;
53 
54     void *reserved[ZEND_MAX_RESERVED_RESOURCES];
55 };

opcode指令:即PHP代碼具體對應的處理動做,與二進制程序中的代碼段對應
字面量存儲:PHP代碼中定義的一些變量初始值、調用的函數名稱、類名稱、常量名稱等等稱之爲字面量,這些值用於執行時初始化變量、函數調用等等
變量分配狀況:與字面量相似,這裏指的是當前opcodes定義了多少變量、臨時變量,每一個變量都有一個對應的編號,執行初始化按照總的數目一次性分配zval,使用時也徹底按照編號索引,而不是根據變量名索引spa

從PHP代碼到opcode是怎麼實現的?最容易想到的方式就是正則匹配,固然過程沒有這麼簡單。PHP編譯過程包括詞法分析、語法分析,使用re2c、bison完成,舊的PHP版本直接生成了opcode,PHP7新增了抽象語法樹(AST),在語法分析階段生成AST,而後再生成opcode數組prototype

相關文章
相關標籤/搜索