假設你在一段陌生的代碼中看到這樣一個函數: git
function toLocalDate(date) { return date.replace(/(\d{2})-(\d{2})-(\d{4})/, "$2-$1-$3") }
單看這個函數你能知道它是想把「日-月-年」替換成「月-日-年」,仍是反過來?匿名捕獲分組無法作到這一點,那就該命名捕獲分組上場了:github
function toLocalDate(date){ return date.replace(/(?<month>\d{2})-(?<day>\d{2})-(?<year>\d{4})/, "$<day>-$<month>-$<year>") }
俗話說的好,「一個好的變量名勝過一行註釋」,命名捕獲分組很大的一個做用就是它能起到註釋的做用。數組
另外,命名捕獲分組還有一個好處,那就是假如你在修改一個正則時,在已有分組的左邊引入了新的分組,那麼你還得記得更新已有的反向引用的數字。好比將 (foo)\1 改爲了 (bar)(foo)\1,那你得把原來的 \1 改爲 \2,replace() 方法的第二個參數裏的 $1 也一樣得改,用命名分組不會有這個問題。函數
命名捕獲分組自身的語法是 (?<name>...),比普通的分組多了一個 ?<name> 字樣,其中 name 的起法就和你平時起變量名同樣便可(不過在這裏關鍵字也可用)。spa
反向引用一個命名分組的語法是 \k<name>,注意命名分組一樣能夠經過數字索引來反向引用,好比:code
/(?<foo>a)\k<foo>\1/.test("aaa") // true
在 replace() 方法的替換字符串中反向引用是用 $<name>:regexp
"abc".replace(/(?<foo>a)/, "$<foo>-") // "a-bc",一樣 $1 仍然可用
總結一下就是,和命名分組相關的有三種語法,分別是 ?<name>、\k<name>、$<name>,相同點是都用尖括號包裹着分組名。對象
const groups = "04-25-2017".match(/(?<month>\d{2})-(?<day>\d{2})-(?<year>\d{4})/).groups // {month: "04", day: "25", year: "2017"} const {day, month, year} = groups
exec() 和 match() 方法返回的匹配結果數組上多了一個 groups 屬性,裏面存放着每一個命名分組的名稱以及它們匹配到的值,利用 ES6 的解構語法,能夠方便的提取出想要的字段。注意這個 groups 屬性只有在當前正則裏至少存在一個命名分組的前提下才會存在,好比:blog
/(\d{2})-(\d{2})-(\d{4})/.exec("04-25-2017").groups // undefined,由於沒有命名分組
replacement 是字符串的狀況上面已經舉過例子了,這裏主要講它是函數的狀況:索引
"04-25-2017".replace(/(?<month>\d{2})-(?<day>\d{2})-(?<year>\d{4})/, (...args) => { const groups = args.slice(-1)[0] const {day, month, year} = groups return `${day}-${month}-${year}` }) // "25-04-2017"
也就是說,在實參列表的最末尾,多傳了一個 groups 對象。一樣,若是正則裏沒有命名分組,這個參數不會存在。
分組名不能有重複項:
/(?<foo>a)(?<foo>b)/ // SyntaxError: Duplicate capture group name
反向引用一個不存在的分組名:
/\k<foo>/u // SyntaxError: Invalid named capture referenced /\k<foo>/.test("k<foo>") // true, 非 Unicode 下爲了向後兼容,k 前面的 \ 會被丟棄
在 reaplce() 方法的替換字符串中引用一個不存在的分組:
"abc".replace(/(?<foo>.*)/, "$<bar>") // SyntaxError: Invalid replacement string "abc".replace(/(.*)/, "$<bar>") // "$<bar>",不包含命名分組時會向後兼容
V8 目前已經徹底實現了命名捕獲分組的提案 https://tc39.github.io/proposal-regexp-named-groups/。
命名分組雖然帶來了一些好處,但我我的以爲,正則越長越難讀懂,尤爲增長的長度是一堆小括號和尖括號。在可讀性上,命名分組也許會起到副作用,尤爲對正則苦手來講。