ECMAScript正則表達式6個最新特性

譯者按: 還沒學好ES6?ECMAScript 2018已經到來啦!javascript

爲了保證可讀性,本文采用意譯而非直譯。另外,本文版權歸原做者全部,翻譯僅用於學習。html

1999年,ECMAScript 3添加了對正則表達式的支持。java

16年以後,ECMAScript 6(即ECMAScript 2015或者ES6)引入了Unicode模式(u選項), sticky模式(y選項)以及RegExp.prototype.flags的getter方法git

這篇博客將介紹ECMAScript正則表達式的最新特性es6

1. dotAll模式(s選項)

這個特性已經在ECMAScript 2018正式發佈了。github

默認狀況下,.能夠匹配任意字符,除了換行符:正則表達式

/foo.bar/u.test('foo\nbar'); // false
複製代碼

另外,.不能匹配Unicode字符,須要使用u選項啓用Unicode模式才行。express

ES2018引入了dotAll模式,經過s選項能夠啓用,這樣,.就能夠匹配換行符了。小程序

/foo.bar/su.test('foo\nbar'); // true
複製代碼

2. Lookbehind斷言

這個特性已經在ECMAScript 2018正式發佈了。微信小程序

ECMAScript目前僅支持lookahead斷言。

下面示例是Positive lookahead,匹配字符串「42 dollars」中緊跟着是"dollars"的數字:

const pattern = /\d+(?= dollars)/u;
const result = pattern.exec('42 dollars');
console.log(result[0]); // 打印42
複製代碼

下面示例是Negative lookahead,匹配字符串「42 pesos」中緊跟着的不是"dollars"的數字:

const pattern = /\d+(?! dollars)/u;
const result = pattern.exec('42 pesos');
console.log(result[0]); // 打印42
複製代碼

ES2018添加了lookbehind斷言

下面示例是Positive lookbehind,匹配字符串「$42」中前面是"$"的數字:

const pattern = /(?<=\$)\d+/u;
const result = pattern.exec('$42');
console.log(result[0]); // 打印42
複製代碼

下面示例是Negative lookbehind,匹配字符串「$42」中前面不是是"$"的數字:

const pattern = /(?<!\$)\d+/u;
const result = pattern.exec('€42');
console.log(result[0]); // 打印42
複製代碼

Fundebug專一於網頁、微信小程序、微信小遊戲,支付寶小程序,React Native,Node.js和Java線上BUG實時監控,歡迎免費試用

3. Named capture groups

這個特性已經在ECMAScript 2018正式發佈了。

目前,正則表達式中小括號匹配的分組是經過數字編號的:

const pattern = /(\d{4})-(\d{2})-(\d{2})/u;
const result = pattern.exec('2017-01-25');
console.log(result[0]); // 打印"2017-01-25"
console.log(result[1]); // 打印"2017"
console.log(result[2]); // 打印"01"
console.log(result[3]); // 打印"25"
複製代碼

這樣很方便,可是可讀性不好,且不易維護。一旦正則表達式中小括號的順序有變化時,咱們就須要更新對應的數字編號。

ES2018添加named capture groups, 能夠指定小括號中匹配內容的名稱,這樣能夠提升代碼的可讀性,也便於維護。

const pattern = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;
const result = pattern.exec('2017-01-25');
console.log(result.groups.year); // 打印"2017"
console.log(result.groups.month); // 打印"01"
console.log(result.groups.day); // 打印"25"
複製代碼

4. Unicode property escapes

這個特性已經在ECMAScript 2018正式發佈了。

Unicode標準爲每個字符分配了多個屬性。好比,當你要匹配希臘語字符時,則能夠搜索Script_Extensions屬性爲Greek的字符。

Unicode property escapes使得咱們可使用ECMAScript正則表達式直接匹配Unicode字符的屬性:

const regexGreekSymbol = /\p{Script_Extensions=Greek}/u;
console.log(regexGreekSymbol.test('π')); // 打印true
複製代碼

5. String.prototype.matchAll

這個特性還處在Stage 3 Draft

g和y選項一般用於匹配一個字符串,而後遍歷全部匹配的子串,包括小括號匹配的分組。String.prototype.matchAll讓這個操做變得更加簡單了。

const string = 'Magic hex numbers: DEADBEEF CAFE 8BADF00D';
const regex = /\b[0-9a-fA-F]+\b/g;
for (const match of string.matchAll(regex)) {
	console.log(match);
}
複製代碼

每個迭代所返回的match對象與regex.exec(string)所返回的結果相同:

// Iteration 1:
[
	'DEADBEEF',
	index: 19,
	input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]

// Iteration 2:
[
	'CAFE',
	index: 28,
	input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]

// Iteration 3:
[
	'8BADF00D',
	index: 33,
	input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'
]
複製代碼

注意,這個特性還處在Stage 3 Draft,所以還存在變化的可能性,示例代碼是根據最新的提案寫的。另外,瀏覽器也尚未支持這個特性。String.prototype.matchAll最快能夠被加入到ECMAScript 2019中。

6. 規範RegExp遺留特性

這個提案還處在Stage 3 Draft

這個提案規範了RegExp的遺留特性,好比RegExp.prototype.compile方法以及它的靜態屬性從RegExp.$1RegExp.$9。雖然這些特性已經棄用(deprecated)了,可是爲了兼容性咱們不能將他們去。所以,規範這些RegExp遺留特性是最好的方法。所以,這個提案有助於保證兼容性。

參考

關於Fundebug

Fundebug專一於JavaScript、微信小程序、微信小遊戲、支付寶小程序、React Native、Node.js和Java實時BUG監控。 自從2016年雙十一正式上線,Fundebug累計處理了6億+錯誤事件,獲得了Google、360、金山軟件等衆多知名用戶的承認。歡迎免費試用!

版權聲明

轉載時請註明做者Fundebug以及本文地址:

blog.fundebug.com/2018/08/30/…

相關文章
相關標籤/搜索