ILBC 規範

時間 2019-11-18

標籤 ilbc 規範简体版

原文原文鏈接

本文是 VMBC / D# 項目的系列文章，html

有關 VMBC / D# ，見《我發起並創立了一個 VMBC 的子項目 D#》（如下簡稱《D#》） http://www.javashuo.com/article/p-zziqptgy-s.html 。java

ILBC 系列文章收錄在《ILBC 白皮書》 http://www.javashuo.com/article/p-bsuuysoc-bo.html 。算法

ILBC 規範：編程

加載程序集：數組

ILBC 程序集有 2 種，安全

1 Byte Code 程序集，擴展名爲 .ilb，表示「ILBC Byte Code」。性能優化

2 Native Code 程序集，擴展名遵循操做系統定義的動態連接庫規範，好比 Windows 上就是 .dll 文件，閉包

Native Code 程序集就是操做系統定義的動態連接庫。架構

假設操做系統是 Windows，程序集名字是 A，加載 A 的過程是：併發

在當前目錄下先查找 A.ilb，若存在則 JIT 編譯 A.ilb 爲本地代碼 A.dll，加載 A.dll，

若找不到 A.ilb，則找 A.dll，若存在則加載 A.dll 。

加載本地庫 A.dll 的方式遵循操做系統定義的動態連接規範。

JIT 編譯 A.ilb 爲本地代碼並加載的過程能夠在內存中完成，不必定要生成文件 A.dll （若是技術上能夠實現在內存中加載的話）。

高級語言（D#）編譯的過程：

高級語言（D#）編譯有 2 種方式，

1 AOT，高級語言（D#）編譯器先根據高級語言（D#）源代碼生成 C 語言中間代碼，再由 InnerC （InnerC to Byte Code）編譯爲表達式樹，再由 InnerC（Byte Code to Native Code）把表達式樹生成爲 Native Code 。 Native Code 是一個本地庫，好比 .dll 。

2 JIT ，高級語言（D#）編譯器先根據高級語言（D#）源代碼生成 C 語言中間代碼，再由 InnerC （InnerC to Byte Code）編譯爲表達式樹，把表達式樹序列化獲得 Byte Code，將 Byte Code 保存爲 ilb 文件即獲得 Byte Code 程序集（.ilb）。

.ilb 在運行的時候由 ILBC 運行時的 InnerC (Byte Code to Native Code) 把 Byte Code 反序列化爲表達式樹，再把表達式樹編譯爲 Native Code 。

把 Native Code 程序集加載到應用程序後， ILBC 運行時會調用程序集的 ILBC_Load() 函數， ILBC_Load() 會建立一個 ILBC_Assembly 結構體，並返回這個結構體的指針， ILBC_Assembly 結構體包含了程序集的元數據信息，相似 .Net / C# 中的 System.Reflection.Assembly 。

元數據就是一堆結構體（Struct），這些 Struct 及 ILBC_Load() 函數的代碼是由高級語言（D#）編譯器生成，代碼以下：

struct ILBC_Assembly

{

ILBC_ClassLoader classLoaderList [ n ] ; // n 是程序集中 Class 的數量，由高級語言（D#）編譯器在編譯時指定

// classLoader 包含了加載 Class 的函數的函數指針（保存在 load 字段裏）

// 每一個 Class 有一個 classLoader，

// classLoaderList 是保存 classLoader 的數組，

// 在 ILBC 運行時加載 Class 時會調用 classLoader.load 保存的函數指針指向的函數，具體內容見下文

// Class 加載完成獲得的 Type 對象保存在 type 字段裏

}

struct ILBC_ClassLoader

{

char * className ; // Class 名字

void * load ; // 加載 Class 的函數的函數指針

ILBC_Type * type = 0 ; // 加載 Class 完成後把 Type 對象保存在這裏

}

struct ILBC_Type

{

char * name ; // Class 名字

int size ; // Class 佔用的空間大小（字節數）

ILBC_Field fieldList [ n ] ; // n 是 Class 中 Field 的數量，由高級語言（D#）編譯器在編譯時指定

int fieldCount ; // C 語言數組的長度須要本身記錄

ILBC_Method methodList [ n ] ; // n 是 Class 中 Method 的數量，由高級語言（D#）編譯器在編譯時指定

int methodCount ; // C 語言數組的長度須要本身記錄

}

struct ILBC_Field

{

char name [ n ] = "字段名" ; // n 應和字段名字符串的字節數相等， n 由高級語言（D#）編譯器在編譯時指定

int size; // 字段佔用的字節數

int offset; // 字段相對於 ILBC_Field 結構體的首地址的偏移量

// ILBC_Type * type ;

char * type ; // type 不能聲明爲 ILBC_Type 或者 ILBC_Type * 類型，由於會形成 Type 和 Field 之間的循環引用，

// 因此先聲明爲 char * （字符串），保存 Type 的名字，經過 GetFieldType() 之類的方法來返回 Type 對象，

// Type 對象就至關於這裏的 ILBC_Type 或者 ILBC_Type * 。

}

struct ILBC_Method

{

char name [ n ] = "方法名"; // n 應和方法名字符串的字節數相等， n 由高級語言（D#）編譯器在編譯時指定

ILBC_Argument * argList [ n ] ; // n 是方法中參數的數量，由高級語言（D#）編譯器在編譯時指定

Type * returnValue ; // 返回值類型

void * funcPtr ; // Method 對應的函數指針

}

struct ILBC_Argument

{

char name [ n ] = "參數名"; // n 應和參數名字符串的字節數相等， n 由高級語言（D#）編譯器在編譯時指定

ILBC_Type * type; // 參數類型

}

看到這裏，是否是跟 C# 反射裏的 AssemblyInfo， Type， FieldInfo， MethodInfo 很像？

是的， ILBC 也要支持完整的元數據架構，元數據用於動態連接和反射。

接下來是 ILBC_Load() 相關的代碼：

假設程序集名字是 B，包含了 Person 類和 Animal 類 2 個類， Person 類有 2 個字段 name, age，有 2 個方法 Sing(0， Smile() ，

void * ILBC_ClassLoaderList_B [ 2 ] ; // 數組長度 2 表示 B 程序集包含了 2 個類

ILBC_Assembly * ILBC_Load()

{

ILBC_Assembly * assembly = ILBC_gcNew( sizeof ( ILBC_Assembly ) ) ;

assembly.classLoaderList [ 0 ].className = "Person" ;

assembly.classLoaderList [ 0 ].load = & ILBC_LoadClass_B_Person ;

assembly.classLoaderList [ 1 ].className = "Animal" ;

assembly.classLoaderList [ 1 ].load = & ILBC_LoadClass_B_Animal ;

return assembly ;

}

ILBC_Type * ILBC_LoadClass_B_Person()

{

ILBC_Type * type = ILBC_gcNew ( sizeof ( ILBC_Type ) );

// ILBC_gcNew( ) 是 ILBC 提供的一個庫函數，用於在堆裏申請一塊空間，這裏是在堆裏建立一個 ILBC_Type 結構體

type.name = "Person";

type.size = 8; // Class 佔用的空間大小（字節數）， name 字段是 char * 類型，假設指針是 32 位地址，佔用 4 個字節， age 是 int 類型，假設是 32 位整數，佔用 4 個字節，那麼 Class 的佔用字節數就是 4 + 4 = 8，即 size = 8; ， size 是由編譯器計算決定的

type.fieldList [ 0 ].name = "name";

type.fieldList [ 0 ].size = // String 是引用類型，因此這裏是引用的 Size

type.fieldList [ 0 ].type = "String"; // 假設基礎庫提供了 String 類型

type.fieldList [ 1 ].name = "age";

type.fieldList [ 1 ].size = 4; // 假設 int 是 32 位整數類型

type.fieldList [ 1 ].type = "Int32"; // 假設 int 是 32 位整數類型，且基礎庫提供的 32 位整數類型是 Int32

type.methodList [ 0 ].name = "Sing";

// 由於 Sing() 方法沒有參數，因此 argList [ 0 ] 長度爲 0，不用初始化

type.methodList [ 0 ].funcPtr = & ILBC_Class_B_Sing; // ILBC_Class_B_Sing 是 Sing() 方法對應的函數，由編譯器生成

type.methodList [ 1 ].name = "Smile";

// 由於 Smile() 方法沒有參數，因此 argList [ 0 ] 長度爲 0，不用初始化

type.methodList [ 1 ].funcPtr = & ILBC_Class_B_Smile; // ILBC_Class_B_Smile 是 Smile() 方法對應的函數，由編譯器生成

return type;

}

ILBC_LoadClass_B_Animal() 函數和 ILBC_LoadClass_B_Person() 函數相似。

當程序中第一次用到程序集時， ILBC 運行時（調度程序）纔會加載程序集，

第一次用到程序集是指第一次用到程序集裏的類，

第一次用到類是指第一次建立對象（ new 類() ）或者第一次調用靜態方法（類.靜態方法() ）、第一次訪問靜態字段（類.靜態字段）這 3 種狀況。

類也是在第一次用到時加載，

固然，第一次加載程序集是必定會加載一個類，但其它的類會在用到時才加載。

加載類完成時會調用類的靜態構造函數。

調度程序加載完程序集後，會把程序集的 ILBC_Load() 返回的 ILBC_Assembly 結構體的指針保存到一個名字是 ILBC_AssemblyList 的鏈表裏，

新加載的程序集的 ILBC_Assembly 結構體的指針會追加到這個鏈表裏。

ILBC_AssemblyList 是調度程序裏的一個全局變量：

ILBC_LinkedList * ILBC_AssemblyList ;

ILBC_LinkedList 是一個鏈表實現， ILBC_LinkedList 自己是一個結構體，定義見下文，再配合一些向鏈表追加元素、刪除元素等函數就是一個鏈表實現，函數的部分略。

struct ILBC_LinkedList

{

ILBC_LinkedListNode * first ; // 鏈表頭指針

ILBC_LinkedListNode * last ; // 鏈表尾指針

}

struct ILBC_LinkedListNode

{

ILBC_LinkedListNode * before ; // 上一個節點

ILBC_LinkedListNode * next ; // 下一個節點

void * element ; // 節點包含的元素，就是實際存放的數據

}

假設有 A 、B 2 個程序集， A 引用了 B，

B 中包含 Class Person， Person 有構造函數 Person() { } ，那麼， A 中 new Person() 的代碼會被編譯成：

void * ILBC_Class_Person_Constructor = 0 ; // 這是 A 裏的全局變量，表示 Person 的構造函數的函數指針， 0 表示空指針，也表示未初始化

……

// 代碼中調用 Person 類構造函數的代碼

// ILBC_Class_Person 是高級語言（D#）編譯器生成的表示 Person 類的 Struct，包含了 Person 類的字段

if ( ! ILBC_ifClassInit_Person )

{

ILBC_Init_Linked_Class_Person() ; // 初始化 Person 類

}

// ILBC_Linked_ClassSize_Person 是一個全局變量，表示 Person 類佔用的空間大小（字節數）

void * person = ILBC_gcNew( ILBC_Linked_ClassSize_Person );

// Person 類初始化後，構造函數指針 ILBC_Linked_Class_Person_Constructor 就被初始化了（填入了 Person 構造函數的地址），就能夠調用了

ILBC_Linked_Class_Person_Constructor ( person ); // 調用 Person 類構造函數，把 person 結構體指針傳給構造函數進行初始化

調用 Person 類的靜態字段和靜態方法的代碼和上面相似，只須要把最後一句代碼換成：

字段類型變量 = * ILBC_Linked_Class_Person_靜態字段名 ; // 訪問靜態字段

ILBC_Linked_Class_Person_靜態函數名 ( 參數列表 ) ; // 調用靜態函數

ILBC_ifClassInit_Person 是一個全局變量，表示 Person 類是否已經初始化，定義以下：

char ILBC_ifClassInit_Person = 0 ;

B 程序集的 Person 類在 A 程序集裏的「初始化」是指完成了 Person 類在 A 裏的連接工做，初始化完成後， A 的代碼就能夠訪問 Person 類了。

訪問 Person 類包括建立對象（new Person() ）、調用函數、訪問字段。

連接工做包括

類連接，向 A 裏定義好的保存 Person 類的佔用空間大小（Size (字節數)）的全局變量寫入類的佔用空間大小（Size (字節數)），

字段連接是向 A 裏定義好的保存 Person 類的各個字段的偏移量的變量寫入字段的偏移量，

函數連接是向 A 裏定義好的保存 Person 類的各個方法的函數地址（函數指針）的變量寫入函數地址，包括構造函數和成員函數。

ILBC_Linked_Class_Person_Constructor 是一個全局變量，表示 Person 類的構造函數的函數指針，定義以下：

void * ILBC_Linked_Class_Person_Constructor ;

ILBC_Init_Linked_Class_Person () 的代碼以下：

ILBC_Init_Linked_Class_Person ()

{

lock ( ILBC_ifClassInit_Person )

{

if ( ! ILBC_ifClassInit_Person )

{

ILBC_Type * type = ILBC_Runtime_GetType( "B", "Person" ) ; // 參數 "B" 表示程序集名字， "Person" 表示類名

ILBC_Linked_ClassSize_Person = type.size ;

// ILBC_Linked_Class_Person_name 是保存 Person 類 name 字段偏移量的全局變量，由編譯器生成，值須要在加載類的時候初始化，也就是下面的代碼裏初始化

// ILBC_Linked_ClassFieldType_Person_name 是保存 Person 類 name 字段類型（類型名字）的常量，由編譯器生成，值由編譯器給出，值就是 name 字段的類型的名字

ILBC_Init_Linked_Class_Field( & ILBC_Linked_Class_Person_name, ILBC_Linked_ClassFieldType_Person_name, "name", type ); // 初始化 name 字段的偏移量

ILBC_Init_Linked_Class_Field( & ILBC_Linked_Class_Person_age, ILBC_Linked_ClassFieldType_Person_age, "age", type ); // 初始化 age 字段的偏移量

// 若是有靜態字段，也是一樣的初始化，不過靜態字段應該不是初始化偏移量，而是直接是地址，

// 靜態字段的指針變量好比「變量類型 * ILBC_Linked_Class_Person_靜態字段名 ;」

ILBC_Init_Linked_Class_Person_Constructor( type ); // 初始化構造函數的函數指針

ILBC_Init_Linked_Class_Method( & ILBC_Linked_Class_Person_Sing, "Sing", type ); // 初始化 Sing() 函數的函數指針

ILBC_Init_Linked_Class_Method( & ILBC_Linked_Class_Person_Smile "Smile", type ); // 初始化 Smile() 函數的函數指針

// 若是有靜態方法，也是一樣的初始化，靜態方法的指針變量好比「void * ILBC_Init_Linked_Class_Person_靜態方法名 ;」

ILBC_ifClassInit_Person = 1 ;

}

void ILBC_Init_Linked_Class_Field( int * fieldOffsetVar, char * fieldType, char * name， ILBC_Type * type )

{

for (int i = 0; i<type.fieldCount; i++)

{

ILBC_Field * field = & type.fieldList [ i ];

if ( field.name == name ) // 這句代碼是僞碼，意思是判斷 2 個字符串是否相等

{

// 咱們這裏判斷類型是否相同是不嚴格的，只是判斷了名字

// 這裏涉及到類型檢查和類型安全，詳細討論見文章最後總結部分

if ( field.type ! = fieldType ) // 這句代碼是僞碼，意思是判斷 2 個字符串是否相等

throw new Exception ( "名字爲 " + name + " 的字段的類型與引用的元數據裏的類型不符。" ); // 這句代碼是僞碼，應該是函數增長一個 errorCode 參數，經過 errorCode 參數返回異常

* fieldOffsetVar = field -> offset;

return ;

}

throw new Exception( "找不到名字是 " + name + " 的字段。" ); // 這句代碼是僞碼，應該是函數增長一個 errorCode 參數，經過 errorCode 參數返回異常

}

void ILBC_Init_Linked_Class_Method ( void * funcPtrVar, char * name, ILBC_Type * type )

{

for (int i = 0; i<type.methodCount; i++)

{

ILBC_Method * method = & type.methodList [ i ];

if ( method.name == name ) // 這句代碼是僞碼，意思是判斷 2 個字符串是否相等

{

* funcPtrVar = method -> funcPtr;

return ;

}

throw new Exception( "找不到名字是 " + name + " 的方法。" ); // 這句代碼也是僞碼，應該是函數增長一個 errorCode 參數，經過 errorCode 參數返回異常

}

相關的全局變量 / 常量總結以下：

char ILBC_ifClassInit_Person = 0 ; // Person 類是否已初始化

int ILBC_Linked_ClassSize_Person ; // Person 類佔用的空間大小（字節數），值由編譯器在編譯 A 項目時根據 B 的元數據給出

int ILBC_Linked_Class_Person_name ; // Person 類 name 字段的偏移量

int ILBC_Linked_Class_Person_age ; // Person 類 age 字段的偏移量

const char * ILBC_Linked_ClassFieldType_Person_name ; // Person 類 name 字段的類型（類型名字）

const char * ILBC_Linked_ClassFieldType_Person_age ; // Person 類 age 字段的類型（類型名字）

void * ILBC_Linked_Class_Person_Constructor ; // Person 類的構造函數函數指針

void * ILBC_Linked_Class_Person_Sing ; // Person 類的 Sing 方法函數指針

void * ILBC_Linked_Class_Person_Smile ; // Person 類的 Smile 方法函數指針

看到這裏，你們可能會問，若是構造函數和方法有重載怎麼辦？

確實有這個問題，這個須要再做進一步的細化設計，如今先略過。

ILBC_Runtime_GetType() 函數的定義以下：

ILBC_Type * ILBC_Runtime_GetType( char * assemblyName, char * typeName )

{

先在 ILBC_AssemblyList 中查找名字是 assemblyName 的程序集是否已存在，

若是不存在，就先加載程序集，

加載程序集的過程上文中提過，就是先把程序集加載到應用程序，再調用程序集的 ILBC_Load() 函數，返回一個 ILBC_Assembly 結構體的指針，

調度程序把這個結構體指針保存到 ILBC_AssemblyList 這個鏈表裏。

找到程序集後，再在 assembly.classLoaderList 裏找名字是 className 的 classLoader，

找到 classLoader 之後，看 classLoader.type 字段是不是空指針（0），若是是，就說明 Class 尚未加載，

就加載 Class，加載 Class 獲得的 Type 對象就存放在 classLoader.type 字段裏。

加載 Class 的過程上文中講述過，假設加載 B 程序集的 Person 對象，

就是調用 B 程序集裏的 ILBC_LoadClass_B_Person() 函數，該函數加載 Person 類，並返回表示 Person 類的 Type 對象的 ILBC_Type 結構體的指針。

調用類的靜態構造函數 ************* 這裏加個着重號，類加載完成後調用類的靜態構造函數

返回 ILBC_Type 結構體的指針。

}

訪問 Person 對象的字段的代碼是：

void * person ;

……

char * name = * ( person + ILBC_Linked_Class_Person_name ) ;

int age = * ( person + ILBC_Linked_Class_Person_age ) ;

調用 Person 對象的方法的代碼是：

void * person ;

ILBC_Linked_Class_Person_Sing ( person ) ; // 調用 Sing() 方法， person 參數是 this 指針

ILBC_Linked_Class_Person_Smile ( person ) ; // 調用 Smile() 方法， person 參數是 this 指針

總結一下：

ILBC 的連接是相似 .Net / C# 的動態連接，

ILBC 的連接以程序集爲單位，採用延遲加載（Lazy Load）的方式，只有用到程序集的時候才加載，「用到」是指第一次用到程序集裏的類（Class）。

將程序集加載到應用程序之後，對程序集裏的類（Class）也採用延遲加載（Lazy Load）的方式，

第一次用到類的時候纔會初始化類的連接表，連接表初始化完成後，就能夠調用類了，包括建立對象，訪問字段和方法。

連接表不是一個「表」，而是一堆全局變量 / 常量，就是上文中列舉出的全局變量 / 常量，這裏再列舉出來看看：

char ILBC_ifClassInit_Person = 0 ; // Person 類是否已初始化

int ILBC_Linked_ClassSize_Person ; // Person 類佔用的空間大小（字節數），值由編譯器在編譯 A 項目時根據 B 的元數據給出

int ILBC_Linked_Class_Person_name ; // Person 類 name 字段的偏移量

int ILBC_Linked_Class_Person_age ; // Person 類 age 字段的偏移量

const char * ILBC_Linked_ClassFieldType_Person_name ; // Person 類 name 字段的類型（類型名字）

const char * ILBC_Linked_ClassFieldType_Person_age ; // Person 類 age 字段的類型（類型名字）

void * ILBC_Linked_Class_Person_Constructor ; // Person 類的構造函數函數指針

void * ILBC_Linked_Class_Person_Sing ; // Person 類的 Sing 方法函數指針

void * ILBC_Linked_Class_Person_Smile ; // Person 類的 Smile 方法函數指針

這些全局變量是 A 裏定義的，是 A 裏引用 B 的連接表。

注意， Class 的加載是在 ILBC 運行時裏進行的，一個 Class 的加載對於整個應用程序只進行一次，

Class 的連接表初始化（Init）是和程序集相關的，假設有 A 、B 、C 3 個程序集引用了 D 程序集，

那麼當 A 用到 D 的時候，會初始化 A 裏引用 D 的連接表，

當 B 用到 D 的時候，會初始化 B 裏引用 D 的連接表，

當 C 用到 D 的時候，會初始化 C 裏引用 D 的連接表。

連接表是屬於程序集的，假設 A 引用了 B C D，那麼 A 裏會有 B C D 的連接表，

也就是說上面的全局變量會在 A 裏聲明 3 組，分別對應 B C D 程序集。

說到這裏，咱們會發現，上面的全局變量的命名沒有包含程序集的名字，好比 ILBC_Linked_Class_Person_name，

這個表示 Person 類的 name 字段的偏移量，

可是並無表示出 Person 類是哪個程序集的。

因此，應該給變量增長一個分隔符（鏈接符）來分隔（鏈接）各項信息，

咱們規定， InnerC 應支持在變量名裏使用 "<>" 字符串，這樣可使用 "<>" 來分隔（鏈接）各項信息。

注意，是 "<>" 字符串，不是 "<"，也不是 ">" ，也不是 "< …… >" ，

好比， a<>b 這個變量名是合法的， a<b 是不合法的， a>b 是不合法的， a<b>c 這個變量名也是不合法的。

ILBC_Linked_Class_Person_name 能夠這樣來表示：

ILBC_Linked<>B<>Person<>name ，這表示連接（引用）的 B 程序集的 Person 類的 name 字段的偏移量

"<>" 字符串在 D# 裏是不能用於程序集名字空間類字段方法的名字的，因此能夠在 C 中間語言裏用在變量名裏做爲分隔符（鏈接符）。

ILBC 運行時調度程序應提供如下函數：

ILBC_Type * ILBC_Runtime_GetType( char * assemblyName, char * typeName )

該函數用於返回指定的程序集名的程序集中指定的類名的類的 Type 對象

ILBC_Type 是調度程序中定義的結構體，爲了能讓程序集訪問，須要高級語言（D#）編譯器引用調度程序發佈的頭文件（.h 文件），

這個頭文件咱們能夠命名爲 ILBC_Runtime.h ，裏面會包含 ILBC_Assembly 、ILBC_ClassLoader 、ILBC_Type 、ILBC_Field 、ILBC_Method 、ILBC_Argument 等結構體定義。

void * ILBC_Runtime_heapNew ( int size )

該函數用於從堆裏分配一塊指定大小的內存塊，參數 size 是內存塊大小（字節數）。返回值是內存塊指針。

ILBC 運行時本身實現了一個堆和 GC 。

固然對應的還會有一個 void ILBC_Runtime_heapFree ( void * ptr, int size ) 函數，

C 語言裏的 void free(void *ptr); 是沒有 size 參數的， So 。

沒事，這個能夠保留討論。

ILBC 程序集應提供如下函數：

ILBC_Assembly * ILBC_Load()

該函數在 ILBC 運行時調度程序加載程序集時調用，負責程序集的初始化工做，

包括建立一個 ILBC_Assembly 結構體，並初始化 ILBC_Assembly 結構體的 classLoaderList 字段，能夠參考上文代碼。

ILBC 運行時調度程序接收到程序集的 ILBC_Load() 函數返回的 ILBC_Assembly 結構體指針後，會將該指針保存到 ILBC_AssemblyList 中，

ILBC_Assembly 是調度程序裏的一個全局變量，是一個鏈表。

說到鏈表，調度程序裏保存 Assembly 的列表 ILBC_AssemblyList 是鏈表，

Assembly 裏保存 Type 的列表 classLoaderList 是數組，

Type 裏保存 Field 、Method 的列表 fieldList, methodList 也是數組，

而上文中根據名字查找 Field 、Method 的算法是遍歷數組，查找 Assembly 、Type 的部分雖然沒有直接用代碼寫出來，但應該是遍歷鏈表 / 數組。

從性能優化的角度來看，根據名字查找成員（Assembly, Type, Field, Method 等）應該優化爲查找 Hash 表，

這個優化關係到加載程序集和類的效率，也是反射的效率。

動態連接程序集，加載程序集和類，就是一個反射的過程。

相傳 .Net 2.0 對反射性能進行了優化，使得反射性能獲得了明顯的提高，大概也是加入了 Hash 表吧！哈哈哈。

而 .Net 對反射進行了優化，理論上自己就是提高了動態連接程序集、加載程序集和類的效率，也就是提高了 .Net 運行應用程序的效率。

在 .Net / C# 裏， Hash 表可使用 Dictionary，但在 IL 裏，估計得本身寫一個。

不過這也是一件好玩的事情，

我接下來會寫一篇文章《本身寫一個 Hash 表》。

《本身寫一個 Hash 表》這篇文章已經寫好了，見 http://www.javashuo.com/article/p-ervzhqtj-dk.html 。

調度程序的 ILBC_Runtime_GetType() 、 ILBC_Runtime_heapNew() 、 ILBC_Runtime_heapFree() 和程序集的 ILBC_Link() 這 4 個函數是操做系統動態連接庫規範定義的動態連接庫導出函數。

這麼考慮主要是以前並未打算本身實現一個 C 編譯器，

但如今既然咱們要本身實現一個 C 編譯器（InnerC），那麼這些就不成問題了，

這 4 個函數能夠用咱們本身定義的規則來訪問。

好比，咱們能夠定義在調度程序的開頭的一段字節來保存 ILBC_Runtime_GetType() 、 ILBC_Runtime_heapNew() 、 ILBC_Runtime_heapFree() 這 3 個函數的地址，在程序集的開頭的一段字節來保存 ILBC_Link() 函數的地址。

這樣，調度程序和程序集之間就能夠經過函數指針來調用接口函數，速度很快。

但若是要這樣的話，調度程序和程序集應該是同構的，同構是指同一種語言、同一個編譯器編譯產生的本地代碼。

因此，調度程序也應該是用 InnerC 編寫和編譯生成的。

這麼一來， InnerC 的地位就很重要了。 ^^

InnerC 是 ILBC 的基礎。

不過這樣一來， InnerC 可能也須要支持結構體，否則很差寫。呵呵。

這樣的話， ILBC 本地代碼程序集就不須要是操做系統定義的動態連接庫，而是按照 ILBC 規範編譯成的本地代碼，咱們能夠把這種按照 ILBC 規範編譯成的本地代碼程序集的擴展名命名爲「.iln」，表示「ILBC Native Code」。

關於泛型，忽然想到，泛型純粹是編譯期檢查，除此之外什麼都不用作，頂多爲每一個泛型類型生成一個具體類型，經過具體類型能夠獲取泛型參數類型就能夠了。

但泛型確實能提升性能，由於泛型不須要運行期類型轉換（Cast），

運行期類型轉換就是一堆 if else ，

咱們能夠看看編譯後生成的代碼，

源代碼：

B b = new B();

A a = (A) b ;

編譯後的代碼：

B b = new B();

A a;

Type aType = typeof(A) ;

Type bType = typeof(B);

if ( aType == bType )

a.ptr = b.ptr ; // 這句是僞碼，表示 b 引用的指針值賦給 a 引用

else if ( aType 是 bType 的父類)

a.ptr = b.ptr ;

else if ( 其它轉型規則 )

a.ptr = b.ptr ; // 或者其它轉型方式，好比拆箱裝箱

else

throw new CastException( "沒法將 " + bType + " 的對象轉換爲 " + aType + " 。" ) ;

而泛型是這樣：

List<string> strList = new List<string>();

strList [ 0 ] = "aa" ;

string s = strList [ 0 ];

編譯後的代碼：

List<string> strList = new List<string>();

strList [ 0 ] = "aa" ;

string s;

s.ptr = strList [ 0 ].ptr; // 指針直接賦值

由於編譯期已經作過類型檢查，因此引用的指針直接賦值，因此泛型沒有性能損耗。

固然， JIT 編譯器須要爲泛型類型生成具體類型，使得泛型類型能夠按照 CLR 的規則「是一個正常的類型」，經過具體類型能夠獲取泛型參數類型。

泛型類型？具體類型？泛型參數類型？

有點繞。

假設有 class A<T> ，

那麼， A<T> 叫泛型類型，

A<string> 叫具體類型，

T ，叫泛型參數類型，好比 A<string> 的泛型參數類型是 string 。

對於 ILBC，具體類型能夠在 C 中間代碼裏生成。

再來看看基礎類型，

基礎類型包括值類型、數組、String，

ILBC 會內置實現基礎類型，

值類型包括 int, long, float, double, char 等，這些類型在 C 語言裏都有對應的類型，可是爲了實現「一切皆對象」，即全部類型，包括值類型和引用類型都從 object 繼承這個架構，還須要對 C 語言裏的 int, long, float, double, char 等作一個包裝，用一個結構體（Struct）來把 int, long, float, double, char 等包起來。

包起來之後，爲了提升執行效率，編譯器還須要對代碼進行一些優化，對於棧裏分配的 int, long, float, double, char 等的加減乘除等運算就直接用 C 語言的 int, long, float, double, char 等的加減乘除等運算，即不用結構體包起來，而是直接編譯爲 C 語言裏的 int, long, float, double, char 等。

而對於

void Foo( object o )

{

Type t = o.GetType() ;

}

這樣的代碼，由於參數 o 多是任意類型，因此傳給參數 o 的 int 類型就應該是包裝過的 int，也就是一個結構體，好比：

struct Int32

{

int val ; // 值

string typeName ; // 類型名字，或者廣義的來講，這個字段表示類型信息

}

Object 的 GetType() 方法經過這個字段返回 Type 對象。

而對於 typeof(int) 則能夠在編譯器編譯爲 Hard Code 返回 Int32 的 Type 對象。

又好比對於 Convert.ChangeType( object o, Type t ) 方法，

假設參數 o 要傳一個 int 類型的話，也須要傳包裝過的 int 類型，也就是上文定義的 struct Int32 。

因此， InnerC 的 InnerC to Byte Code 模塊，除了語法分析器，又增長了一個模塊，優化器。

So ……

語法分析器產生表達式對象樹後，把表達式樹傳給優化器，優化器能夠閱讀表達式樹，發現能夠優化的地方能夠修改表達式樹，

修改後的表達式樹就是優化後的表達式樹，再傳給 Byte Code to Native Code，編譯爲本地代碼。

能夠把優化後的表達式樹再逆向爲 C 代碼，這樣就能夠看到優化後的 C 中間代碼。

InnerC 的 InnerC to Byte Code 能夠提供逆向的功能。

再來看結構體（Struct），

D# / ILBC 不打算提供結構體，由於結構體沒什麼用。 ^^

提供結構體會讓 ILBC 的設計變得複雜，增長了研發成本。

固然結構體使用棧空間，減小了堆管理和 GC 的工做，可是從線程的角度來看，棧比較大的話線程切換的性能消耗可能也比較大。看你怎麼看了 ~ 。

出於動態連接的要求， .Net / C# 的結構體應該不是在編譯期靜態分配內存空間的，而是在運行期分配空間，由於結構體保存在棧裏，因此是動態分配棧空間。

因此， .Net / C# 裏建立結構體也是用 new 關鍵字。

D# / ILBC 的 DateTime 類型是一個引用類型（Class），是一個能夠用 D# 寫的普通的引用類型（Class）。

.Net / C# 的 DateTime 是值類型，我估計 .Net / C# 如今想把 DateTime 改爲 Class，可是改不過來了。哈哈哈哈。

如上文所述， D# / ILBC 提供的基礎類型是基礎類型值類型、數組、String，值類型包括 int, long, float, double, char 等，

基礎類型由 D# / ILBC 內置實現。

其它類型由 D# 編寫，包括 DateTime 及基礎庫裏的各類類型。

說到基礎庫，就會想到和本地代碼的交互性，就是訪問本地代碼，

在 .Net / C# 裏，託管代碼和本地代碼之間的交互使用 P / Invoke ，

對於 D# / ILBC，會提供這樣一些接口：

1 指針

2 申請一段非託管內存，非託管內存不會由 GC 回收，須要手動回收

3 回收一段非託管內存

有了這 3 個接口，基本上就夠了，能夠訪問非託管代碼了。

非託管內存和託管內存同屬一個堆，只是 GC 不會回收非託管內存。

再來看類型檢查和類型安全，

上文中初始化連接表的字段偏移量時會對字段類型進行檢查， A 程序集在運行期連接的 B 程序集的 Person 類的字段類型應該和 A 程序集在編譯期引用的 B 程序集的 Person 類的類型一致，不然認爲類型不匹配，不容許連接，也就是不容許使用如今的 Person 類。

爲何要進行類型檢查？

若是類型不匹配，會發生訪問了不應訪問的內存的錯誤，這種錯誤難以排查，產生的結果是意想不到的，

這也是 java， .Net 這類虛擬機（運行時）出現要解決的問題吧！

java, .Net 這類虛擬機（運行時）經過運行期類型檢查來實現類型安全，避免類型錯誤致使訪問了錯誤的內存。

.Net / C# 對類型的檢查是嚴格準確的，全部類型最終會歸結到基礎類型（值類型數組 String），

而基礎類型都是 .Net 內置類型，是強名稱的，能夠嚴格的檢查，

推而廣之， .Net 基礎庫都是強名稱的，能夠準確的檢查類型，

對於開發人員本身編寫的類，也能夠根據字段逐一校驗，實際加載的程序集的類的字段應包含大於等於編譯時引用的程序集的類的字段，字段名字和類型必須匹配，好比編譯時引用的 Person 類的 name 字段是 String 類，那麼運行期加載的 B 的 Person 類也應該要有 name 字段，且類型應該是 String，不然認爲類型不匹配。

咱們上文對字段類型的檢查是不嚴格的，只是檢查類型的名字。

應該注意的是，強名稱類型檢查不表明內存安全，強名稱只是驗證程序集（類）的身份，可是類若是自己存在 Bug，也會發生訪問了自身對象之外的內存的問題。

可是，因爲數組做爲基礎類型提供，數組中會判斷「索引是否超出數組界限」，因此，開發者寫的代碼通常應該不會發生訪問內存越界（訪問了自身對象之外的內存）的問題。

固然這僅限於託管代碼，對於非託管代碼，由於指針的存在，因此有可能發生訪問內存越界的問題。

.Net / C# 解決這個問題的作法是，把指針用 IntPtr 類型封裝起來，不容許修改，只是做爲一個常量數值傳遞。

另外一方面，若是 Class Size（類佔用的空間大小(Size)）、字段偏移量、方法的函數地址這 3 項元數據都是動態連接的話，

類型檢查其實也沒什麼好查的。 ^^

由於這 3 項元數據都是來源於同一個類，是自洽的，若是發生了訪問內存越界的問題，是類自身代碼的邏輯問題。

強名稱檢查是驗證程序集（類）的身份。

爲何要動態連接 Class Size（類佔用的空間大小(Size)）、字段偏移量？

這是爲了兼容性，好比， B 程序集的 Person 類如今有 name, age 2 個字段，後來又加了一個 favour 字段，這樣就改變了 Class Size，

name, age 的偏移量也可能會發生改變，

可是應該讓原來引用了 B 程序集的應用程序能繼續正常使用 Person 類，

因此須要動態連接 Class Size 和字段偏移量。

考慮到軟件被攻擊和破解的風險，能夠考慮加入像 .Net / C# 同樣的強名稱程序集的功能。

不過若是是 AOT 編譯的話，即便沒有強名稱，要破解也沒有那麼容易，由於 AOT 編譯生成的是本地代碼。 ^^

咱們上面說程序集和類型的名字，好比調用 ILBC_Runtime_GetType( "B", "Person" ) 函數返回 Person 的 ILBC_Type 結構體指針，

"B" 是程序集名字， "Person" 是類名，

這段代碼是舉例，咱們給程序集名字和類型的名字下一個定義：

程序集名字是程序集文件的文件名（不包含擴展名），

類型的全名（Full Name）是「名字空間.類名」，這個和 C# 同樣。

假設名字空間是「B」，則 Person 類的全名是「B.Person」，

上文調用 ILBC_Runtime_GetType( "B", "Person" ) 函數的類名應該是類的全名「B.Person」。

若是 D# / ILBC 支持強名稱程序集，則對於強名稱程序集， Full Name 中還會包含強名稱版本信息，能夠認爲和 .Net / C# 同樣。

咱們再詳細說明一下高級語言（D#）編譯的過程，

高級語言（D#）編譯會生成 2 個文件，

1 元數據文件，

2 程序集文件

上文中沒有交代元數據文件，

元數據文件保存了程序集的元數據信息，包括類，類的字段（字段名、字段類型），方法（方法簽名），

高級語言（D#）編譯器能夠根據元數據知道程序集有哪些成員（類，類的字段，類的方法），

這樣能夠用於開發時的智能提示，以及編譯時的類型檢查。

最重要的是高級語言（D#）編譯器須要根據元數據生成程序集中加載 Class 的代碼，

加載 Class 的代碼就是上文中的 ILBC_Type * ILBC_LoadClass_B_Person() 函數，

這個函數就是「Class Loader」，是保存在 ILBC_Assembly 結構體的 classLoaderList 字段中，

classLoaderList 是一個數組，元素是 ILBC_ClassLoader 結構體， ILBC_ClassLoader 結構體的 load 字段就是保存「Class Loader」函數的函數指針的字段。

程序集文件多是 Byte Code 程序集，也多是本地代碼程序集，

若是是 JIT 編譯方式，就是 Byte Code 程序集，

若是是 AOT 編譯方式，就是本地代碼程序集，

高級語言（D#）編譯器編譯時只須要元數據文件，不須要程序集文件，

應用程序運行的時候只須要程序集文件，不須要元數據文件。

元數據文件就像是 C 語言的頭文件。

因此， ILBC 涉及的文件會有這麼幾種：

1 元數據文件

2 C 中間代碼文件，這個不是必需的，可是做爲調試研究學習，能夠生成出來。

3 Byte Code 程序集文件，

4 本地代碼程序集文件，

咱們能夠對這 4 種文件命名擴展名：

1 元數據文件，擴展名「.ild」，表示「ILBC Meta Data」，

2 C 中間代碼文件，擴展名「.ilc」，表示「ILBC C Code」，

3 Byte Code 程序集文件，擴展名「.ilb」，表示「ILBC Byte Code」，

4 本地代碼程序集文件，擴展名「.iln」，表示「ILBC Native Code」，

好的， ILBC 規範暫時就寫這麼多，

接下來的計劃是堆、 GC 、 InnerC 語法分析器。

有網友提出不須要沿襲傳統的面向對象方式，而是能夠用和 Rust 類似的方式，

我下面寫一段代碼把這種方式描述一下：

class C1

{

int f1;

string f2;

}

void M1( C1 this )

{

……

}

void M2( C1 this)

{

……

}

這就是 C1 類的定義，方法定義在外面，相似 C# 的擴展方法，

這至關於傳統的面向對象裏 C1 類有 2 個方法（M1(), M2()），

咱們在定義一個 C2 類，讓 C2 「繼承」 C1 類：

class C2 : C1

{

}

再把 M1() 的定義改一下：

void M1( C2 C1 this )

{

……

}

this 參數的類型加入了 C2，由 C2 C1 共同做爲 this 參數的類型，

這樣 C2 就繼承了 C1 的 M1() 方法，，，注意只繼承了 M1() 方法，沒有繼承 M2() 方法。

C2 能夠添加本身的字段，也能夠多繼承，固然若是「父類」之間有重名的字段，就不能同時繼承有重名字段的父類。

C2 也能夠添加本身的方法，事實上這也不能說是本身的方法，這個方法不只僅能在「父子」類之間共享，

也能在「毫無關係」的類之間共享，只要方法內對 this 引用的字段在類裏存在就行。

這種作法確實挺呵呵的，但也很爽。

這種作法我稱之爲「靜態綁定」，由於和 Javascript 的「動態綁定」類似，只不過這是在編譯期進行的，因此叫「靜態綁定」。

同時，從編譯期「靜態」的角度，又和泛型很像。

網友說這種作法「只須要結構體和擴展方法就行，不須要類。」，

確實，就是這樣，只要有結構體和擴展方法就能夠。

說的直一點，只要有結構體和函數就能夠。

我要呵呵了，這算是面向過程 -> 面向對象 -> 面向過程麼？

通過後來的討論和思考， D# 仍是不打算這樣作， D# 的目標是實現一個經典的簡潔的面向對象語言。

D# 會支持簡潔的面向對象和函數式。

簡潔的面向對象包括單繼承、接口、抽象類 / 抽象方法 / 虛方法，

函數式是閉包。

不過，關於上述的「靜態綁定」的作法，卻是討論清楚了，「綁定」有 3 種：

1 靜態綁定，在編譯期爲每一個綁定生成一份方法（函數）代碼，每一份函數代碼邏輯相同，區別是訪問對象字段的偏移量。

2 靜態綁定，方法（函數）只有一份，但在編譯期爲每一個綁定生成一段綁定代碼，綁定代碼的邏輯是把對象字段的偏移量轉換爲函數裏對應的偏移量。

3 動態綁定，在運行期爲綁定生成綁定代碼。

關於堆和 GC，個人想法是這樣：

GC 根據 2 張表來回收對象（內存），

1 引用表

2 對象表

這 2 張表其實是鏈表，

每次 new 對象的時候，會把對象添加到對象表裏，

每次給引用賦值的時候，會把引用添加到引用表裏，

每次引用超出做用域，或者引用被賦值爲 null 時，會將引用從引用表裏刪除，固然這段代碼是編譯器生成的。

這樣， GC 回收對象（內存）的時候，就先掃描引用表，對引用表裏的引用指向的對象，在對象表裏作一個標記，表示這個對象還在使用，

掃描完引用表後，掃描對象表，若是對象未被標記還在使用，就表示已經沒有引用在指向對象，能夠回收對象。

而要在每次給引用賦值的時候把引用添加到引用表，須要 lock 引用表，把對象添加到對象表也須要 lock 對象表。

lock 會帶來性能損耗，經過測試能夠看到， C# 中 lock 的時間花費大約是 new 的 3 倍（new 應該要查找和修改堆表，因此應該也有 lock），

執行次數比較小時，小於 3，好比 10 萬次，

執行次數比較大時，大於 3，好比 1 億次，

因此，看起來， C# 的 new 的 lock 的效率比 lock 關鍵字的 lock 的效率高，

或者說，若是咱們用上述的架構，給引用賦值時把引用添加到引用表，使用 lock 關鍵字來實現 lock，

這樣對性能的影響很大，只要想一想給引用賦值的性能花費比 new 還大就知道了，

從測試結果上來看， new 的執行應該是指令級的，大概在 5 個指令之內就能夠完成，

對於 .Net / C# 這樣有 GC 的語言，應該只須要從剩餘空間中分配內存塊就能夠，不須要像 C / C++ 那樣用樹操做查找最接近要分配的內存塊大小的空閒空間，

再加上 lock 的時間，所有加起來大概在 5 個指令之內，

lock 大概佔 2 個指令，開始 lock 佔 1 個指令，結束 lock 佔 1 個指令，

固然這些是估算。

因此能夠看出來， .Net / C# 的 new 操做對堆表的 lock 是指令級的，不是調用操做系統的 lock 原語，

這樣的目的是讓 new 的操做很快，接近 O(1)，

對於 ILBC 而言，若是採用給引用賦值時修改引用表， new 對象時修改對象表，

那麼，修改引用表和對象表的操做也應該接近 O(1)，就是像 .Net / C# 的 new 同樣，這樣纔有足夠的效率。

這就是說，修改引用表和對象表的 lock 也要像 .Net / C# 的 new 對堆表的 lock 同樣，是指令級的。

這就須要咱們本身來實現一個 lock，而不是使用操做系統的 lock 原語。

怎麼來實現本身的一個 lock ？

根據網上查閱的結果，光從軟件層面是不行的，光從 C 語言層面也不行，須要硬件的支持和彙編編程。

能夠參考《聊聊C++中的原子操做》 https://baijiahao.baidu.com/s?id=1609585581486387645&wfr=spider&for=pc ，

《java併發中的原子變量和原子操做以及CAS介紹》 https://blog.csdn.net/wxw520zdh/article/details/53731146 ，

文中提到「CAS …… 雖然看似複雜，但倒是 Java 5 併發機制優於原有鎖機制的根本。」，

而 CAS 是經過 CPU 提供的 CMPXCHG 指令支持，能夠參考《cpu cmpxchg 指令理解 (CAS)》 https://blog.csdn.net/xiuye2015/article/details/53406432 ，

因此咱們能夠用 CMPXCHG 指令來實現 lock ，原理是這樣：

在內存裏用一個字來存儲 lock 標誌（flag），若是是 64 位處理器，則字長是 64，即 8 個字節（Byte），

簡化起見，咱們就不考慮 32 位處理器了，只考慮 64 位處理器。

當要 lock 時，用 CMPXCHG 指令比較 flag 是否等於 0，若是相等則將當前線程 ID 複製到 flag，這表示當前線程得到了鎖，接着執行鎖裏要執行的操做就行。

若是不等於 0，則 CMPXCHG 指令會把當前 flag 的值複製到指定的寄存器裏，檢查寄存器裏的 flag 值是否是當前線程 ID，若是是，表示在當前線程的鎖範圍內，接着執行鎖裏要執行的操做就行。

若是 flag 值不等於當前線程 ID，表示當前鎖由別的線程佔有，則當前線程掛起，掛起前會把指令計數器再次指向上述檢查鎖的指令，下次恢復運行時，會從新執行上述檢查鎖的操做。

咱們能夠用多個字來表示多個 lock，好比用一個字表示引用表 lock，一個字表示對象表 lock，一個字表示堆表 lock，等等。

固然，爲了提升效率，對象表 lock 和堆表 lock 大概能夠合爲一個 lock，由於修改對象表和堆表都發生在 new 操做的時候，能夠把 new 操做做爲一個原子操做，只用一個 lock，這樣， new 操做包含的 2 個步驟修改對象表和修改堆表都在一個 lock 裏進行。

這種作法相比操做系統的 lock 原語，可能更簡單，可是功能也相對侷限，好比不能支持嵌套 lock，以及必須預先爲每一種 lock 分配一個字，而操做系統 lock 是能夠動態 lock 的，好比 C# 中只要調用 Monitor.Enter() 方法就能夠開始 lock，一般咱們是用 lock 關鍵字，這在編譯期被編譯器處理爲 Monitor.Enter() 和 Monitor.Exit() 方法對，可是若是在運行期調用 Monitor.Enter() 方法，也是能夠開始 lock 的。

操做系統的 lock 可能是利用了虛擬內存，或者說存儲管理部件，只須要在存儲管理的鎖表裏設置要鎖定的地址，存儲管理部件會判斷是否容許訪問該地址。

設置鎖表的原理是，在鎖表裏設置當前線程 ID 和要鎖定的地址，若是相同的線程 ID + 鎖定地址已經存在，則設置失敗，設置失敗則線程掛起，等下次恢復運行時再接着設置。

設置成功則表示當前線程得到對指定地址的鎖，存儲管理部件將只容許當前線程訪問指定地址，不容許其它線程訪問指定地址。

事實上，咱們用 CMPXCHG 指令的作法也能夠實現和操做系統相似的效果，包括動態的鎖定任意的對象（不須要預先分配字），也支持嵌套 lock，

這須要在 object 類（全部引用類型的基類）裏加入一個 lock 字段，當咱們 lock 某個對象時，會先看 lock 字段是否等於 0，若是等於 0，則寫入當前線程號，這樣就得到了對該對象的鎖，若是不等於 0，則比較是否等於當前線程 ID，若是等於，表示對象被當前對象鎖定，因而接着執行鎖定裏的操做，若是不等，表示對象被其它線程鎖定，則當前線程掛起，等下次恢復運行時，重複上述過程。

這個過程和上面敘述的利用 CMPXCHG 指令實現鎖的過程是同樣的，但不用預先分配字，用 object 的 lock 字段做爲這個「字」就能夠。

判斷 object 的 lock 字段是否等於 0，若等於則寫入當前線程號，返回 true，不然 lock 字段不變，返回 false，這個操做是「原子操做」，這個原子操做就是 CMPXCHG 指令實現的。

但用咱們的作法有一個條件，就是須要在全部（可能併發）訪問對象的地方都加上 lock，

而操做系統的鎖則沒必要需，操做系統因爲是利用虛擬內存（存儲管理部件）實現的，因此在代碼的 a 處加了 lock， b 處不加 lock，但 a 處鎖定對象，則 b 處將不能訪問。

雖然如此，咱們在使用操做系統 lock 的時候，一般也會在 a 處和 b 處都加上 lock，這是爲了設計意圖的須要，咱們須要 a 和 b 嚴格的同步（互斥）通訊，就須要給 a 處和 b 處都加上 lock 。

我把咱們的作法稱爲「IL Lock」，用關鍵字 illock 表示，

把操做系統的 lock 稱爲「System Lock」，用關鍵字 syslock 表示，

在 D# 中，使用 IL Lock 能夠這樣寫：

illock ( obj )

{

……

}

使用 System Lock 能夠這樣寫：

syslock ( obj )

{

……

}

理論上，咱們能夠提倡使用 IL Lock，這樣能夠得到比 System Lock 更高的性能。 ^^

好的，堆和 GC 的部分基本理清了，接下來會開始 InnerC 語法分析器。

到目前爲止， InnerC 在 ILBC 的地位變得重要， InnerC 會是 ILBC 的內核模塊。

InnerC 支持基礎類型（int, long, float, double, char）， if else, for, while，函數，指針，數組，結構體，

InnerC 不保證支持 Ansi C 的所有標準，

InnerC 還會有一些新的特性：

1 對 void * 類型的函數指針不檢查函數簽名，能夠調用任意的參數列表和返回任意的返回值，固然調用了不匹配的參數列表就會發生錯誤，可能致使程序崩潰，這個特性是用在 C 中間代碼裏，不建議開發人員使用。

對於聲明瞭函數簽名的函數指針，仍然會檢查調用的參數列表及返回值是否符合函數簽名（指針類型），開發人員應使用這種方式，保證安全性。

2 爲了便於實現一些動態特性和對本地代碼訪問的靈活性， InnerC 支持用函數指針調用動態的參數列表，參數列表是一個數組，相似 .Net / C# 的反射，把參數放在數組裏傳給 MethodInfo.Invoke( object[] args ) 方法。

初步構想能夠增長一個 invoke 關鍵字，能夠用於函數指針的函數調用，好比：

void * funcPtr ;

void * args ;

……

( * funcPtr ) ( invoke args ) ; // 調用 funcPtr 指向的函數，參數列表是 args

3 新增 casif 關鍵字以支持 casif 語句。

casif 語句相似 if 語句，但判斷條件是經過 CMPXCHG 指令實現的 CAS 原子操做， CAS 全稱「Compare and Swap」。

casif 語句格式以下：

casif ( 參數1, 參數2, 參數3 )

{

語句塊 1

}

else

{

語句塊 2

}

參數1 是一個變量或者常量，參數2 是一個指針，參數3 是一個變量或者常量，

當參數1 和參數2 指向的值相等時，把參數3 的值複製到參數2 指向的存儲單元，並認爲判斷條件成立，執行語句塊 1 。

不然認爲判斷條件不成立，執行語句塊 2 。

其實上面說的用 CMPXCHG 指令實現 IL Lock 的作法還有一點問題，其實不須要向對象的 lock 字段寫入當前線程 ID，只要寫入 1 就能夠， 1 表示對象被鎖定， 0 表示對象未被鎖定。

這樣邏輯就更簡化了。

對引用表對象表堆表的 lock 都會統一使用 IL Lock 。

暫時先寫到這裏， ILBC 目前計劃發展 2 門高級語言， D# 和 c3 ， c3 由一位網友提出，參考《c3 語言草案》 https://note.youdao.com/ynoteshare1/index.html?id=bec52576b45ec0d918a95f75db0ea68e&type=note#/ 。

內容有點多，因此後面的內容放到了《ILBC 規範 2》 http://www.javashuo.com/article/p-uqmiarbb-g.html 。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。