(再聲明一下,爲了簡單暴力的講解AST的轉換過程,這裏的編譯內容以"'Hello' + ' World'"做爲案例)
上一篇基本上花了一整篇講完了scanner的Init方法,接下來就是Scan了,Init的方法基本上都是在Stream類下操做,可是本節回到了scanner層級。
void Scanner::Scan() { Scan(next_); }
void Scanner::Scan(TokenDesc* next_desc) {
next_desc->token = ScanSingleToken();
next_desc->location.end_pos = source_pos();
}複製代碼
雖然這裏只有簡簡單單的兩步(砍掉了全部的CHECK和DEBUG內容),但這個ScanSingleToken已經夠講了。從字面意思理解,就是對單個詞法的解析,源碼以下。
V8_INLINE Token::Value Scanner::ScanSingleToken() {
Token::Value token;
do {
next().location.beg_pos = source_pos();
if (V8_LIKELY(static_cast<unsigned>(c0_) <= kMaxAscii)) {
token = one_char_tokens[c0_];
switch (token) {
case Token::LPAREN:
case Token::RPAREN:
return Select(token);
case Token::STRING:
return ScanString();
default:
UNREACHABLE();
}
}
} while (token == Token::WHITESPACE);
return token;
}複製代碼
做爲一個詞法解析方法,長度其實仍是能夠接受的,已經刪掉了大部分的case判斷,因爲本系列專一於"'Hello' + ' World'"的編譯,因此留下了STRING類型。
講兩個點,第一個是那個source_pos,位置的屬性和方法是真的多,比較簡單,看看就好了。
static const int kCharacterLookaheadBufferSize = 1;
int source_pos() {
return static_cast<int>(source_->pos()) - kCharacterLookaheadBufferSize;
}複製代碼
而後那個mapping數組能夠稍微給一下出處,源碼以下。
#define INT_0_TO_127_LIST(V) \ V(0) V(1) V(2) V(3) V(4) V(5) V(6) V(7) V(8) V(9) \
V(120) V(121) V(122) V(123) V(124) V(125) V(126) V(127)
static const constexpr Token::Value one_char_tokens[128] = {
#define CALL_GET_SCAN_FLAGS(N) GetOneCharToken(N),
INT_0_TO_127_LIST(CALL_GET_SCAN_FLAGS)
#undef CALL_GET_SCAN_FLAGS
};
constexpr Token::Value GetOneCharToken(char c) {
return
c == '(' ? Token::LPAREN :
c == ')' ? Token::RPAREN :
IsDecimalDigit(c) ? Token::NUMBER :
IsAsciiIdentifier(c) ? Token::IDENTIFIER :
Token::ILLEGAL;
}複製代碼
以前說過,c0_表明的是當前解析字符的Unicode編碼,因而這裏直接經過數組索引查找其對應的類型,按照例子中,咱們的字符是一個單引號,而單引號的類型以下。
c == '"' ? Token::STRING :
c == '\'' ? Token::STRING :
c == '`' ? Token::TEMPLATE_SPAN :複製代碼
因此,當前token被賦值爲Token::STRING,所以,case分支進入ScanString的方法。這個方法內容比較多,下一篇講吧,午休時間。