ES6學習筆記(三)

ES6增強了對Unicode的支持,而且擴展了字符串對象。html

一、字符的Unicode表示法

JavaScript容許採用\uxxxx形式表示一個字符,其中「xxxx」表示字符的碼點。java

"\u0061"
// "a"

 

可是,這種表示法只限於\u0000——\uFFFF之間的字符。超出這個範圍的字符,必須用兩個雙字節的形式表達。git

"\uD842\uDFB7"
// "𠮷"

"\u20BB7"
// " 7"

 

上面代碼表示,若是直接在「\u」後面跟上超過0xFFFF的數值(好比\u20BB7),JavaScript會理解成「\u20BB+7」。因爲\u20BB是一個不可打印字符,因此只會顯示一個空格,後面跟着一個7。github

ES6對這一點作出了改進,只要將碼點放入大括號,就能正確解讀該字符。正則表達式

"\u{20BB7}"
// "𠮷"

"\u{41}\u{42}\u{43}"
// "ABC"

let hello = 123;
hell\u{6F} // 123

'\u{1F680}' === '\uD83D\uDE80'
// true

 

上面代碼中,最後一個例子代表,大括號表示法與四字節的UTF-16編碼是等價的。數組

有了這種表示法以後,JavaScript共有6種方法能夠表示一個字符。app

'\z' === 'z'  // true
'\172' === 'z' // true
'\x7A' === 'z' // true
'\u007A' === 'z' // true
'\u{7A}' === 'z' // true

 

二、codePointAt()

JavaScript內部,字符以UTF-16的格式儲存,每一個字符固定爲2個字節。對於那些須要4個字節儲存的字符(Unicode碼點大於0xFFFF的字符),JavaScript會認爲它們是兩個字符。函數

var s = "𠮷";

s.length // 2
s.charAt(0) // ''
s.charAt(1) // ''
s.charCodeAt(0) // 55362
s.charCodeAt(1) // 57271

 

上面代碼中,漢字「𠮷」的碼點是0x20BB7,UTF-16編碼爲0xD842 0xDFB7(十進制爲55362 57271),須要4個字節儲存。對於這種4個字節的字符,JavaScript不能正確處理,字符串長度會誤判爲2,並且charAt方法沒法讀取整個字符,charCodeAt方法只能分別返回前兩個字節和後兩個字節的值。測試

ES6提供了codePointAt方法,可以正確處理4個字節儲存的字符,返回一個字符的碼點。this

var s = '𠮷a';

s.codePointAt(0) // 134071
s.codePointAt(1) // 57271

s.charCodeAt(2) // 97

 

codePointAt方法的參數,是字符在字符串中的位置(從0開始)。上面代碼中,JavaScript將「𠮷a」視爲三個字符,codePointAt方法在第一個字符上,正確地識別了「𠮷」,返回了它的十進制碼點134071(即十六進制的20BB7)。在第二個字符(即「𠮷」的後兩個字節)和第三個字符「a」上,codePointAt方法的結果與charCodeAt方法相同。

總之,codePointAt方法會正確返回32位的UTF-16字符的碼點。對於那些兩個字節儲存的常規字符,它的返回結果與charCodeAt方法相同。

codePointAt方法返回的是碼點的十進制值,若是想要十六進制的值,可使用toString方法轉換一下。

var s = '𠮷a';

s.codePointAt(0).toString(16) // "20bb7"
s.charCodeAt(2).toString(16) // "61"

 

你可能注意到了,codePointAt方法的參數,仍然是不正確的。好比,上面代碼中,字符a在字符串s的正確位置序號應該是1,可是必須向charCodeAt方法傳入2。解決這個問題的一個辦法是使用for...of循環,由於它會正確識別32位的UTF-16字符。

var s = '𠮷a';
for (let ch of s) {
  console.log(ch.codePointAt(0).toString(16));
}
// 20bb7
// 61

 

codePointAt方法是測試一個字符由兩個字節仍是由四個字節組成的最簡單方法。

function is32Bit(c) {
  return c.codePointAt(0) > 0xFFFF;
}

is32Bit("𠮷") // true
is32Bit("a") // false

 

三、String.fromCodePoint()

ES5提供String.fromCharCode方法,用於從碼點返回對應字符,可是這個方法不能識別32位的UTF-16字符(Unicode編號大於0xFFFF)。

String.fromCharCode(0x20BB7)
// "ஷ"

 

上面代碼中,String.fromCharCode不能識別大於0xFFFF的碼點,因此0x20BB7就發生了溢出,最高位2被捨棄了,最後返回碼點U+0BB7對應的字符,而不是碼點U+20BB7對應的字符。

ES6提供了String.fromCodePoint方法,能夠識別0xFFFF的字符,彌補了String.fromCharCode方法的不足。在做用上,正好與codePointAt方法相反。

String.fromCodePoint(0x20BB7)
// "𠮷"
String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x\uD83D\uDE80y'
// true

 

上面代碼中,若是String.fromCodePoint方法有多個參數,則它們會被合併成一個字符串返回。

注意,fromCodePoint方法定義在String對象上,而codePointAt方法定義在字符串的實例對象上。

四、字符串的遍歷器接口

ES6爲字符串添加了遍歷器接口(詳見《Iterator》一章),使得字符串能夠被for...of循環遍歷。

for (let codePoint of 'foo') {
  console.log(codePoint)
}
// "f"
// "o"
// "o"

 

除了遍歷字符串,這個遍歷器最大的優勢是能夠識別大於0xFFFF的碼點,傳統的for循環沒法識別這樣的碼點。

var text = String.fromCodePoint(0x20BB7);

for (let i = 0; i < text.length; i++) {
  console.log(text[i]);
}
// " "
// " "

for (let i of text) {
  console.log(i);
}
// "𠮷"

 

上面代碼中,字符串text只有一個字符,可是for循環會認爲它包含兩個字符(都不可打印),而for...of循環會正確識別出這一個字符。

五、at()

ES5對字符串對象提供charAt方法,返回字符串給定位置的字符。該方法不能識別碼點大於0xFFFF的字符。

'abc'.charAt(0) // "a"
'𠮷'.charAt(0) // "\uD842"

 

上面代碼中,charAt方法返回的是UTF-16編碼的第一個字節,其實是沒法顯示的。

目前,有一個提案,提出字符串實例的at方法,能夠識別Unicode編號大於0xFFFF的字符,返回正確的字符。

'abc'.at(0) // "a"
'𠮷'.at(0) // "𠮷"

 

這個方法能夠經過墊片庫實現。

六、normalize()

許多歐洲語言有語調符號和重音符號。爲了表示它們,Unicode提供了兩種方法。一種是直接提供帶重音符號的字符,好比Ǒ(\u01D1)。另外一種是提供合成符號(combining character),即原字符與重音符號的合成,兩個字符合成一個字符,好比O(\u004F)和ˇ(\u030C)合成Ǒ(\u004F\u030C)。

這兩種表示方法,在視覺和語義上都等價,可是JavaScript不能識別。

'\u01D1'==='\u004F\u030C' //false

'\u01D1'.length // 1
'\u004F\u030C'.length // 2

 

上面代碼表示,JavaScript將合成字符視爲兩個字符,致使兩種表示方法不相等。

ES6提供字符串實例的normalize()方法,用來將字符的不一樣表示方法統一爲一樣的形式,這稱爲Unicode正規化。

'\u01D1'.normalize() === '\u004F\u030C'.normalize()
// true

 

normalize方法能夠接受一個參數來指定normalize的方式,參數的四個可選值以下。

  • NFC,默認參數,表示「標準等價合成」(Normalization Form Canonical Composition),返回多個簡單字符的合成字符。所謂「標準等價」指的是視覺和語義上的等價。
  • NFD,表示「標準等價分解」(Normalization Form Canonical Decomposition),即在標準等價的前提下,返回合成字符分解的多個簡單字符。
  • NFKC,表示「兼容等價合成」(Normalization Form Compatibility Composition),返回合成字符。所謂「兼容等價」指的是語義上存在等價,但視覺上不等價,好比「囍」和「喜喜」。(這只是用來舉例,normalize方法不能識別中文。)
  • NFKD,表示「兼容等價分解」(Normalization Form Compatibility Decomposition),即在兼容等價的前提下,返回合成字符分解的多個簡單字符。
'\u004F\u030C'.normalize('NFC').length // 1
'\u004F\u030C'.normalize('NFD').length // 2

 

上面代碼表示,NFC參數返回字符的合成形式,NFD參數返回字符的分解形式。

不過,normalize方法目前不能識別三個或三個以上字符的合成。這種狀況下,仍是隻能使用正則表達式,經過Unicode編號區間判斷。

七、includes(), startsWith(), endsWith()

傳統上,JavaScript只有indexOf方法,能夠用來肯定一個字符串是否包含在另外一個字符串中。ES6又提供了三種新方法。

  • includes():返回布爾值,表示是否找到了參數字符串。
  • startsWith():返回布爾值,表示參數字符串是否在源字符串的頭部。
  • endsWith():返回布爾值,表示參數字符串是否在源字符串的尾部。
var s = 'Hello world!';

s.startsWith('Hello') // true
s.endsWith('!') // true
s.includes('o') // true

 

這三個方法都支持第二個參數,表示開始搜索的位置。

var s = 'Hello world!';

s.startsWith('world', 6) // true
s.endsWith('Hello', 5) // true
s.includes('Hello', 6) // false

 

上面代碼表示,使用第二個參數n時,endsWith的行爲與其餘兩個方法有所不一樣。它針對前n個字符,而其餘兩個方法針對從第n個位置直到字符串結束。

八、repeat()

repeat方法返回一個新字符串,表示將原字符串重複n次。

'x'.repeat(3) // "xxx"
'hello'.repeat(2) // "hellohello"
'na'.repeat(0) // ""

 

參數若是是小數,會被取整。

'na'.repeat(2.9) // "nana"

 

若是repeat的參數是負數或者Infinity,會報錯。

'na'.repeat(Infinity)
// RangeError
'na'.repeat(-1)
// RangeError

 

可是,若是參數是0到-1之間的小數,則等同於0,這是由於會先進行取整運算。0到-1之間的小數,取整之後等於-0repeat視同爲0。

'na'.repeat(-0.9) // ""

 

參數NaN等同於0。

'na'.repeat(NaN) // ""

 

若是repeat的參數是字符串,則會先轉換成數字。

'na'.repeat('na') // ""
'na'.repeat('3') // "nanana"

 

九、padStart(),padEnd()

ES7推出了字符串補全長度的功能。若是某個字符串不夠指定長度,會在頭部或尾部補全。padStart用於頭部補全,padEnd用於尾部補全。

'x'.padStart(5, 'ab') // 'ababx'
'x'.padStart(4, 'ab') // 'abax'

'x'.padEnd(5, 'ab') // 'xabab'
'x'.padEnd(4, 'ab') // 'xaba'

 

上面代碼中,padStartpadEnd一共接受兩個參數,第一個參數用來指定字符串的最小長度,第二個參數是用來補全的字符串。

若是原字符串的長度,等於或大於指定的最小長度,則返回原字符串。

'xxx'.padStart(2, 'ab') // 'xxx'
'xxx'.padEnd(2, 'ab') // 'xxx'

 

若是用來補全的字符串與原字符串,二者的長度之和超過了指定的最小長度,則會截去超出位數的補全字符串。

'abc'.padStart(10, '0123456789')
// '0123456abc'

 

若是省略第二個參數,則會用空格補全長度。

'x'.padStart(4) // '   x'
'x'.padEnd(4) // 'x   '

padStart的常見用途是爲數值補全指定位數。下面代碼生成10位的數值字符串。

'1'.padStart(10, '0') // "0000000001"
'12'.padStart(10, '0') // "0000000012"
'123456'.padStart(10, '0') // "0000123456"

另外一個用途是提示字符串格式。

'12'.padStart(10, 'YYYY-MM-DD') // "YYYY-MM-12"
'09-12'.padStart(10, 'YYYY-MM-DD') // "YYYY-09-12"

 

十、模板字符串

傳統的JavaScript語言,輸出模板一般是這樣寫的。

$('#result').append(
  'There are <b>' + basket.count + '</b> ' +
  'items in your basket, ' +
  '<em>' + basket.onSale +
  '</em> are on sale!'
);

上面這種寫法至關繁瑣不方便,ES6引入了模板字符串解決這個問題。

$('#result').append(`
  There are <b>${basket.count}</b> items
   in your basket, <em>${basket.onSale}</em>
  are on sale!
`);

模板字符串(template string)是加強版的字符串,用反引號(`)標識。它能夠看成普通字符串使用,也能夠用來定義多行字符串,或者在字符串中嵌入變量。

// 普通字符串
`In JavaScript '\n' is a line-feed.`

// 多行字符串
`In JavaScript this is
 not legal.`

console.log(`string text line 1
string text line 2`);

// 字符串中嵌入變量
var name = "Bob", time = "today";
`Hello ${name}, how are you ${time}?`

上面代碼中的模板字符串,都是用反引號表示。若是在模板字符串中須要使用反引號,則前面要用反斜槓轉義。

var greeting = `\`Yo\` World!`;

若是使用模板字符串表示多行字符串,全部的空格和縮進都會被保留在輸出之中。

$('#list').html(`
<ul>
  <li>first</li>
  <li>second</li>
</ul>
`);

 

上面代碼中,全部模板字符串的空格和換行,都是被保留的,好比<ul>標籤前面會有一個換行。若是你不想要這個換行,可使用trim方法消除它。

$('#list').html(`
<ul>
  <li>first</li>
  <li>second</li>
</ul>
`.trim());

 

模板字符串中嵌入變量,須要將變量名寫在${}之中。

function authorize(user, action) {
  if (!user.hasPrivilege(action)) {
    throw new Error(
      // 傳統寫法爲
      // 'User '
      // + user.name
      // + ' is not authorized to do '
      // + action
      // + '.'
      `User ${user.name} is not authorized to do ${action}.`);
  }
}

 

大括號內部能夠放入任意的JavaScript表達式,能夠進行運算,以及引用對象屬性。

var x = 1;
var y = 2;

`${x} + ${y} = ${x + y}`
// "1 + 2 = 3"

`${x} + ${y * 2} = ${x + y * 2}`
// "1 + 4 = 5"

var obj = {x: 1, y: 2};
`${obj.x + obj.y}`
// 3

 

模板字符串之中還能調用函數。

function fn() {
  return "Hello World";
}

`foo ${fn()} bar`
// foo Hello World bar

 

若是大括號中的值不是字符串,將按照通常的規則轉爲字符串。好比,大括號中是一個對象,將默認調用對象的toString方法。

若是模板字符串中的變量沒有聲明,將報錯。

// 變量place沒有聲明
var msg = `Hello, ${place}`;
// 報錯

 

因爲模板字符串的大括號內部,就是執行JavaScript代碼,所以若是大括號內部是一個字符串,將會原樣輸出。

`Hello ${'World'}`
// "Hello World"

 

模板字符串甚至還能嵌套。

const tmpl = addrs => `
  <table>
  ${addrs.map(addr => `
    <tr><td>${addr.first}</td></tr>
    <tr><td>${addr.last}</td></tr>
  `).join('')}
  </table>
`;

 

上面代碼中,模板字符串的變量之中,又嵌入了另外一個模板字符串,使用方法以下。

const data = [
    { first: '<Jane>', last: 'Bond' },
    { first: 'Lars', last: '<Croft>' },
];

console.log(tmpl(data));
// <table>
//
//   <tr><td><Jane></td></tr>
//   <tr><td>Bond</td></tr>
//
//   <tr><td>Lars</td></tr>
//   <tr><td><Croft></td></tr>
//
// </table>

 

若是須要引用模板字符串自己,在須要時執行,能夠像下面這樣寫。

// 寫法一
let str = 'return ' + '`Hello ${name}!`';
let func = new Function('name', str);
func('Jack') // "Hello Jack!"

// 寫法二
let str = '(name) => `Hello ${name}!`';
let func = eval.call(null, str);
func('Jack') // "Hello Jack!"

 

十一、實例:模板編譯

下面,咱們來看一個經過模板字符串,生成正式模板的實例。

var template = `
<ul>
  <% for(var i=0; i < data.supplies.length; i++) { %>
    <li><%= data.supplies[i] %></li>
  <% } %>
</ul>
`;

 

上面代碼在模板字符串之中,放置了一個常規模板。該模板使用<%...%>放置JavaScript代碼,使用<%= ... %>輸出JavaScript表達式。

怎麼編譯這個模板字符串呢?

一種思路是將其轉換爲JavaScript表達式字符串。

echo('<ul>');
for(var i=0; i < data.supplies.length; i++) {
  echo('<li>');
  echo(data.supplies[i]);
  echo('</li>');
};
echo('</ul>');

 

這個轉換使用正則表達式就好了。

var evalExpr = /<%=(.+?)%>/g;
var expr = /<%([\s\S]+?)%>/g;

template = template
  .replace(evalExpr, '`); \n  echo( $1 ); \n  echo(`')
  .replace(expr, '`); \n $1 \n  echo(`');

template = 'echo(`' + template + '`);';

 

而後,將template封裝在一個函數裏面返回,就能夠了。

var script =
`(function parse(data){
  var output = "";

  function echo(html){
    output += html;
  }

  ${ template }

  return output;
})`;

return script;

 

將上面的內容拼裝成一個模板編譯函數compile

function compile(template){
  var evalExpr = /<%=(.+?)%>/g;
  var expr = /<%([\s\S]+?)%>/g;

  template = template
    .replace(evalExpr, '`); \n  echo( $1 ); \n  echo(`')
    .replace(expr, '`); \n $1 \n  echo(`');

  template = 'echo(`' + template + '`);';

  var script =
  `(function parse(data){
    var output = "";

    function echo(html){
      output += html;
    }

    ${ template }

    return output;
  })`;

  return script;
}

 

compile函數的用法以下。

var parse = eval(compile(template));
div.innerHTML = parse({ supplies: [ "broom", "mop", "cleaner" ] });
//   <ul>
//     <li>broom</li>
//     <li>mop</li>
//     <li>cleaner</li>
//   </ul>

 

十二、標籤模板

模板字符串的功能,不只僅是上面這些。它能夠緊跟在一個函數名後面,該函數將被調用來處理這個模板字符串。這被稱爲「標籤模板」功能(tagged template)。

alert`123`
// 等同於
alert(123)

 

標籤模板其實不是模板,而是函數調用的一種特殊形式。「標籤」指的就是函數,緊跟在後面的模板字符串就是它的參數。

可是,若是模板字符裏面有變量,就不是簡單的調用了,而是會將模板字符串先處理成多個參數,再調用函數。

var a = 5;
var b = 10;

tag`Hello ${ a + b } world ${ a * b }`;
// 等同於
tag(['Hello ', ' world ', ''], 15, 50);

 

上面代碼中,模板字符串前面有一個標識名tag,它是一個函數。整個表達式的返回值,就是tag函數處理模板字符串後的返回值。

函數tag依次會接收到多個參數。

function tag(stringArr, value1, value2){
  // ...
}

// 等同於

function tag(stringArr, ...values){
  // ...
}

 

tag函數的第一個參數是一個數組,該數組的成員是模板字符串中那些沒有變量替換的部分,也就是說,變量替換隻發生在數組的第一個成員與第二個成員之間、第二個成員與第三個成員之間,以此類推。

tag函數的其餘參數,都是模板字符串各個變量被替換後的值。因爲本例中,模板字符串含有兩個變量,所以tag會接受到value1value2兩個參數。

tag函數全部參數的實際值以下。

  • 第一個參數:['Hello ', ' world ', '']
  • 第二個參數: 15
  • 第三個參數:50

也就是說,tag函數實際上如下面的形式調用。

tag(['Hello ', ' world ', ''], 15, 50)

 

咱們能夠按照須要編寫tag函數的代碼。下面是tag函數的一種寫法,以及運行結果。

var a = 5;
var b = 10;

function tag(s, v1, v2) {
  console.log(s[0]);
  console.log(s[1]);
  console.log(s[2]);
  console.log(v1);
  console.log(v2);

  return "OK";
}

tag`Hello ${ a + b } world ${ a * b}`;
// "Hello "
// " world "
// ""
// 15
// 50
// "OK"

 

下面是一個更復雜的例子。

var total = 30;
var msg = passthru`The total is ${total} (${total*1.05} with tax)`;

function passthru(literals) {
  var result = '';
  var i = 0;

  while (i < literals.length) {
    result += literals[i++];
    if (i < arguments.length) {
      result += arguments[i];
    }
  }

  return result;
}

msg // "The total is 30 (31.5 with tax)"

 

上面這個例子展現了,如何將各個參數按照原來的位置拼合回去。

passthru函數採用rest參數的寫法以下。

function passthru(literals, ...values) {
  var output = "";
  for (var index = 0; index < values.length; index++) {
    output += literals[index] + values[index];
  }

  output += literals[index]
  return output;
}

 

「標籤模板」的一個重要應用,就是過濾HTML字符串,防止用戶輸入惡意內容。

var message =
  SaferHTML`<p>${sender} has sent you a message.</p>`;

function SaferHTML(templateData) {
  var s = templateData[0];
  for (var i = 1; i < arguments.length; i++) {
    var arg = String(arguments[i]);

    // Escape special characters in the substitution.
    s += arg.replace(/&/g, "&amp;")
            .replace(/</g, "&lt;")
            .replace(/>/g, "&gt;");

    // Don't escape special characters in the template.
    s += templateData[i];
  }
  return s;
}

 

上面代碼中,sender變量每每是用戶提供的,通過SaferHTML函數處理,裏面的特殊字符都會被轉義。

var sender = '<script>alert("abc")</script>'; // 惡意代碼
var message = SaferHTML`<p>${sender} has sent you a message.</p>`;

message
// <p>&lt;script&gt;alert("abc")&lt;/script&gt; has sent you a message.</p>

 

標籤模板的另外一個應用,就是多語言轉換(國際化處理)。

i18n`Welcome to ${siteName}, you are visitor number ${visitorNumber}!`
// "歡迎訪問xxx,您是第xxxx位訪問者!"

 

模板字符串自己並不能取代Mustache之類的模板庫,由於沒有條件判斷和循環處理功能,可是經過標籤函數,你能夠本身添加這些功能。

// 下面的hashTemplate函數
// 是一個自定義的模板處理函數
var libraryHtml = hashTemplate`
  <ul>
    #for book in ${myBooks}
      <li><i>#{book.title}</i> by #{book.author}</li>
    #end
  </ul>
`;

 

除此以外,你甚至可使用標籤模板,在JavaScript語言之中嵌入其餘語言。

jsx`
  <div>
    <input
      ref='input'
      onChange='${this.handleChange}'
      defaultValue='${this.state.value}' />
      ${this.state.value}
   </div>
`

 

上面的代碼經過jsx函數,將一個DOM字符串轉爲React對象。你能夠在Github找到jsx函數的具體實現

下面則是一個假想的例子,經過java函數,在JavaScript代碼之中運行Java代碼。

java`
class HelloWorldApp {
  public static void main(String[] args) {
    System.out.println(「Hello World!」); // Display the string.
  }
}
`
HelloWorldApp.main();

 

模板處理函數的第一個參數(模板字符串數組),還有一個raw屬性。

tag`First line\nSecond line`

function tag(strings) {
  console.log(strings.raw[0]);
  // "First line\\nSecond line"
}

 

上面代碼中,tag函數的第一個參數strings,有一個raw屬性,也指向一個數組。該數組的成員與strings數組徹底一致。好比,strings數組是["First line\nSecond line"],那麼strings.raw數組就是["First line\\nSecond line"]。二者惟一的區別,就是字符串裏面的斜槓都被轉義了。好比,strings.raw數組會將\n視爲\\n兩個字符,而不是換行符。這是爲了方便取得轉義以前的原始模板而設計的。

1三、String.raw()

ES6還爲原生的String對象,提供了一個raw方法。

String.raw方法,每每用來充當模板字符串的處理函數,返回一個斜槓都被轉義(即斜槓前面再加一個斜槓)的字符串,對應於替換變量後的模板字符串。

String.raw`Hi\n${2+3}!`;
// "Hi\\n5!"

String.raw`Hi\u000A!`;
// 'Hi\\u000A!'

 

若是原字符串的斜槓已經轉義,那麼String.raw不會作任何處理。

String.raw`Hi\\n`
// "Hi\\n"

 

String.raw的代碼基本以下。

String.raw = function (strings, ...values) {
  var output = "";
  for (var index = 0; index < values.length; index++) {
    output += strings.raw[index] + values[index];
  }

  output += strings.raw[index]
  return output;
}

 

String.raw方法能夠做爲處理模板字符串的基本方法,它會將全部變量替換,並且對斜槓進行轉義,方便下一步做爲字符串來使用。

String.raw方法也能夠做爲正常的函數使用。這時,它的第一個參數,應該是一個具備raw屬性的對象,且raw屬性的值應該是一個數組。

String.raw({ raw: 'test' }, 0, 1, 2);
// 't0e1s2t'

// 等同於
String.raw({ raw: ['t','e','s','t'] }, 0, 1, 2);

 

1四、模板字符串的限制

前面提到標籤模板裏面,能夠內嵌其餘語言。可是,模板字符串默認會將字符串轉義,所以致使了沒法嵌入其餘語言。

舉例來講,在標籤模板裏面能夠嵌入Latex語言。

function latex(strings) {
  // ...
}

let document = latex`
\newcommand{\fun}{\textbf{Fun!}}  // 正常工做
\newcommand{\unicode}{\textbf{Unicode!}} // 報錯
\newcommand{\xerxes}{\textbf{King!}} // 報錯

Breve over the h goes \u{h}ere // 報錯
`

 

上面代碼中,變量document內嵌的模板字符串,對於Latex語言來講徹底是合法的,可是JavaScript引擎會報錯。緣由就在於字符串的轉義。

模板字符串會將\u00FF\u{42}看成Unicode字符進行轉義,因此\unicode解析時報錯;而\x56會被看成十六進制字符串轉義,因此\xerxes會報錯。

爲了解決這個問題,如今有一個提案,放鬆對標籤模板裏面的字符串轉義的限制。若是遇到不合法的字符串轉義,就返回undefined,而不是報錯,而且從raw屬性上面能夠獲得原始字符串。

function tag(strs) {
  strs[0] === undefined
  strs.raw[0] === "\\unicode and \\u{55}";
}
tag`\unicode and \u{55}`

 

上面代碼中,模板字符串本來是應該報錯的,可是因爲放鬆了對字符串轉義的限制,因此不報錯了,JavaScript引擎將第一個字符設置爲undefined,可是raw屬性依然能夠獲得原始字符串,所以tag函數仍是能夠對原字符串進行處理。

注意,這種對字符串轉義的放鬆,只在標籤模板解析字符串時生效,不是標籤模板的場合,依然會報錯。

let bad = `bad escape sequence: \unicode`; // 報錯
相關文章
相關標籤/搜索