先聲明一下,這種長系列的大塊頭博客只能保證儘量的深刻到每一行源碼,有些代碼我不樂意深究就寫個註釋說明一下做用。另外,因爲本地整理的比較好,博客就隨心寫了。
整個Compile過程目前只看到asmjs以前,簡單的過了幾遍,大部分方法沒有點進去看,實在是太複雜了。上一篇的結尾指出了AST的入口,也就是命名空間parsing的一個公共方法,以下。
bool ParseProgram(ParseInfo* info, Isolate* isolate) {
Parser parser(info);
FunctionLiteral* result = nullptr;
result = parser.ParseProgram(isolate, info);
info->set_literal(result);
return (result != nullptr);
}複製代碼
所須要關心的核心代碼就是這些,很是簡單,Parser對象的初始化屬性很是多,這裏就不列出來了。
接下來進入第二個核心方法,即ParseProgram。
FunctionLiteral* Parser::ParseProgram(Isolate* isolate, ParseInfo* info) {
scanner_.Initialize();
FunctionLiteral* result = DoParseProgram(isolate, info);
return result;
}複製代碼
一樣,所須要關心代碼只有兩行,其中第一步則是啓動了scanner的初始化,第二步則是開始全面解析。
Scanner包含scanner、scanner-character-strams兩個部分,其中stream則是通過初步處理的源String,必須轉換後才能進行解析。處理的過程在以前省略的代碼中,這裏稍微給出大概的轉換流程。
bool ParseProgram(ParseInfo* info, Isolate* isolate) {
Handle<String> source(String::cast(info->script()->source()), isolate);
std::unique_ptr<Utf16CharacterStream> stream(ScannerStream::For(isolate, source));
info->set_character_stream(std::move(stream));
}
Utf16CharacterStream* ScannerStream::For(Isolate* isolate, Handle<String> data, int start_pos, int end_pos) {
size_t start_offset = 0;
if (data->IsSeqOneByteString()) {
return new BufferedCharacterStream<OnHeapStream>(
static_cast<size_t>(start_pos), Handle<SeqOneByteString>::cast(data),
start_offset, static_cast<size_t>(end_pos));
}
}複製代碼
常規的字符串通常都是OneByteString,這裏就不細講了。最後返回一個特殊Stream類,其屬性記錄字符串的長度、當前的解析進度、解析的開始與結束標記等等。
將字符串轉換後,就能夠利用Scanner來進行逐步解析,在此以前,須要對Scanner類有一個簡單的瞭解,以下。
class V8_EXPORT_PRIVATE Scanner {
public:
Token::Value peek() const { return next().token; }
const Location& location() const { return current().location; }
private:
uc32 c0_;
TokenDesc* current_;
TokenDesc* next_;
TokenDesc* next_next_;
Utf16CharacterStream* const source_;
}複製代碼
選取了一些比較簡單的屬性和方法,Scanner內部有三個遊標屬性負責遍歷字符串,分別是current_、next_、next_next_,字面意思理解就好了。source_則是以前說的轉換Stream類,全部的解析實際上都是調用這個屬性的方法。而兩個結構體TokenDesc、Location也很是重要,一個負責詞法描述,一個負責記錄詞法位置信息,以下。
struct TokenDesc {
Location location = {0, 0};
LiteralBuffer literal_chars;
LiteralBuffer raw_literal_chars;
Token::Value token = Token::UNINITIALIZED;
MessageTemplate invalid_template_escape_message = MessageTemplate::kNone;
Location invalid_template_escape_location;
uint32_t smi_value_ = 0;
bool after_line_terminator = false;
}複製代碼
經過這個結構體和一些方法,就能完整的將源字符串逐步轉換爲抽象語法樹。可是實際轉換過程很是複雜,分支極多,後面再繼續探究。