正則表達式文檔整理

模糊匹配


橫向模糊匹配git

{m,n},表示連續出現最少 m 次,最多 n 次。bash

好比正則/ab{2,5}c/ 表示匹配這樣一個字符串:第一個字符是 "a",接下來是 2 到 5 個字符 "b",最後是字符 "c"。ide

測試以下:測試

var regex=/ab{2,5}c/g;
var string="abc abbc abbbc abbbbc abbbbbc";
console.log(string.match(regex));
// => ["abbc","abbbc","abbbbc","abbbbbc"]
複製代碼

tips:

/ab{2,5}c/g,其中g是正則的一個修飾符。表示全局匹配,即,在目標字符串中按順序找到知足匹配模式的全部子串,強調的是「全部」,而不僅是「第一個」。g 是單詞 global 的首字母。idea

縱向模糊匹配spa

[abc],表示該字符是能夠字符 "a"、"b"、"c" 中的任何一個。code

好比 /a[123]b/能夠匹配以下三種字符串: "a1b"、"a2b"、"a3b"。cdn

測試以下:blog

var regex = /a[123]b/g;
var string = "a0b a1b a2b a3b a4b";
console.log( string.match(regex) );
// => ["a1b", "a2b", "a3b"]
複製代碼

字符組

範圍表示法ip

[123456abcdefGHIJKLM],可寫成[1-6a-fG-M]。用連字符 - 來省略和簡寫。

因爲連字符有特殊用途,那麼要匹配"a","-","z"這三者中任意一個字符,該如何作?

可寫成[-az][az-][a\-z].即要麼放在開頭,要麼放在結尾,要麼轉義。

排除字符組

[^abc],表示是一個除 "a"、"b"、"c"以外的任意一個字 符。字符組的第一位放 ^(脫字符),表示求反的概念。

常見簡寫形式

字符組 具體含義
\d 表示 [0-9]。表示是一位數字。 記憶方式:其英文是 digit(數字)。
\D 表示 [^0-9]。表示除數字外的任意字符。
\w 表示 [0-9a-zA-Z_]。表示數字、大小寫字母和下劃線。 記憶方式:w 是 word 的簡寫,也稱單詞字符。
\W 表示 [^0-9a-zA-Z_]。非單詞字符。
\s 表示 [ \t\v\n\r\f]。表示空白符,包括空格、水平製表符、垂直製表符、換行符、回車符、換頁 符。 記憶方式:s 是 space 的首字母,空白符的單詞是 white space。
\S 表示 [^ \t\v\n\r\f]。 非空白符。
. 表示 [^\n\r\u2028\u2029]。通配符,表示幾乎任意字符。換行符、回車符、行分隔符和段分隔符 除外。 記憶方式:想一想省略號 ... 中的每一個點,均可以理解成佔位符,表示任何相似的東西。

量詞

簡寫形式

貪婪匹配與惰性匹配

var regex = /\d{2,5}/g;
var string = "123 1234 12345 123456";
console.log( string.match(regex) );
// => ["123", "1234", "12345", "12345"]
複製代碼

其中正則 /\d{2,5}/,表示數字連續出現 2 到 5 次。會匹配 2 位、3 位、4 位、5 位連續數字。

可是其是貪婪的,它會盡量多的匹配。你能給我 6 個,我就要 5 個。你能給我 3 個,我就要 3 個。 反正只要在能力範圍內,越多越好。

惰性匹配,就是儘量少的匹配:

var regex = /\d{2,5}?/g;
var string = "123 1234 12345 123456";
console.log( string.match(regex) );
// => ["12", "12", "34", "12", "34", "12", "34", "56"]
複製代碼

其中 /\d{2,5}?/ 表示,雖然 2 到 5 次都行,當 2 個就夠的時候,就再也不往下嘗試了。

經過在量詞後面加個問號就能實現惰性匹配,所以全部惰性匹配情形以下:

多選分支

一個模式能夠實現橫向和縱向模糊匹配。而多選分支能夠支持多個子模式任選其一。

具體形式以下:(p1|p2|p3),其中 p一、p2 和 p3 是子模式,用 |(管道符)分隔,表示其中任何之一。

測試以下:

var regex = /good|nice/g;
  var string = "good idea, nice try.";
  console.log( string.match(regex) );
  // => ["good", "nice"]
複製代碼

分支結構也是惰性的,即當前面的匹配上了,後面的就再也不嘗試了.

未完待續。。。

相關文章
相關標籤/搜索