不少時候多會被正則表達式搞的暈頭轉向,最近抽出時間對正則表達式進行了系統的學習,整理以下:javascript
兩種方法,一種是直接寫,由包含在斜槓之間的模式組成;另外一種是調用 RegExp
對象的構造函數。前端
兩種方法的建立代碼以下:java
// 直接建立
const regex1 = /ab+c/;
const regex2 = /^[a-zA-Z]+[0-9]*\W?_$/gi;
// 調用構造函數
const regex3 = new RegExp('ab+c');
const regex4 = new RegExp(/^[a-zA-Z]+[0-9]*\W?_$/, "gi");
const regex5 = new RegExp('^[a-zA-Z]+[0-9]*\W?_$', 'gi');
複製代碼
能夠看出,調用 RegExp
構造函數建立正則表達式時,第一個參數能夠是字符串,也能夠是直接建立的正則表達式。正則表達式
須要注意的是:RegExp
實例繼承的 toLocaleString()
和 toString)()
方法都會返回正則表達式的字面量,與建立正則表達式的方式無關。函數
例如:學習
const ncname = '[a-zA-Z_][\\w\\-\\.]*';
const qnameCapture = '((?:' + ncname + '\\:)?' + ncname + ')';
const startTagOpen = new RegExp('^<' + qnameCapture);
// '/^<((?:[a-zA-Z_][\w\-\.]*\:)?[a-zA-Z_][\w\-\.]*)/'
startTagOpen.toString();
複製代碼
\
(反斜槓)ui
注意:在使用 RegExp
構造函數時要將\轉譯,由於 \
在字符串裏也是轉譯字符。spa
^
code
[]
中的第一位時表示反向字符集;例:regexp
/^A/.exec('an A') // null
/^A/.exec('An E') // ["A", index: 0, input: "An E"]
複製代碼
$
匹配輸入的結束
/t$/.exec('eater') // null
/t$/.exec('eat') // ["t", index: 2, input: "eat"]
複製代碼
*
, +
, .
(小數點)
*
:匹配前一個表達式0次或屢次。等價於 {0,}
;
+
:匹配前面一個表達式1次或者屢次。等價於 {1,}
;
.
:匹配除換行符以外的任何單個字符;
?
(問號)
{0,1}
;* + ? {}
的後面,將會使量詞變爲非貪婪的(匹配儘可能少的字符),和缺省使用的貪婪模式正好相反;例子:
/\d+/.exec('123abc') // ["123", index: 0, input: "123abc"]
/\d+?/.exec('123abc') // ["1", index: 0, input: "123abc"]
複製代碼
(x)
匹配 x
而且記住匹配項,括號表示捕獲括號;
例:
/(foo) (bar) \1 \2/.test('bar foo bar foo'); // false
/(bar) (foo) \1 \2/.test('bar foo bar foo'); // true
/(bar) (foo) \1 \2/.test('bar foo'); // false
/(bar) (foo) \1 \2/.test('bar foo foo bar'); // false
/(bar) (foo) \2 \1/.test('bar foo foo bar'); // true
'bar foo bar foo'.replace( /(bar) (foo)/, '$2 $1' ); // "foo bar bar foo"
複製代碼
模式 /(foo) (bar) \1 \2/
中的 (foo)
和 (bar)
匹配並記住字符串 foo bar foo bar
中前兩個單詞。模式中的 \1
和 \2
匹配字符串的後兩個單詞。
注意:\1
、\2
、\n
是用在正則表達式的匹配環節,在正則表達式的替換環節,則要使用像 $1
、$2
、$n
這樣的語法。例如,'bar foo'.replace( /(...) (...)/, '$2 $1' )
。
(?:x)
匹配 x
可是不記住匹配項,這種叫做非捕獲括號;
例:
'foo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foo"]
'foo'.match(/(?:foo){1,2}/) // ["foo", index: 0, input: "foo"]
'foofoo'.match(/(?:foo){1,2}/) // ["foofoo", index: 0, input: "foofoo"]
'foofoo'.match(/foo{1,2}/) // ["foo", index: 0, input: "foofoo"]
複製代碼
使用場景:示例表達式 /(?:foo){1,2}/
。若是表達式是 /foo{1,2}/
,{1,2}
將只對 foo
的最後一個字符 ’o‘
生效。若是使用非捕獲括號,則 {1,2}
會匹配整個 foo
單詞。
x(?=y)
, x(?!y)
, x|y
x(?=y)
:匹配'x'僅僅當'x'後面跟着'y';
x(?!y)
:匹配'x'僅僅當'x'後面不跟着'y';
x|y
: 匹配x或y;
這兩種匹配的結果都不包含y。
例:
'JackSprat'.match(/Jack(?=Sprat)/) // ["Jack", index: 0, input: "JackSprat"]
'JackWprat'.match(/Jack(?=Sprat)/) // null
'JackWprat'.match(/Jack(?=Sprat|Wprat)/) // ["Jack", index: 0, input: "JackWprat"]
/\d+(?!\.)/.exec("3.141") // ["141", index: 2, input: "3.141"]
複製代碼
{n}
, {n,m}
:
{n}
:匹配了前面一個字符恰好發生了n次;
{n,m}
:匹配前面的字符至少n次,最多m次。若是 n 或者 m 的值是0, 這個值被忽略;
例:
/a{2}/.exec('candy') // null
/a{2}/.exec('caandy') // ["aa", index: 1, input: "caandy"]
/a{2}/.exec('caaandy') // ["aa", index: 1, input: "caaandy"]
/a{1,3}/.exec('candy') // ["a", index: 1, input: "candy"]
/a{1,3}/.exec('caandy') // ["aa", index: 1, input: "caandy"]
/a{1,3}/.exec('caaandy') // ["aaa", index: 1, input: "caaandy"]
/a{1,3}/.exec('caaaandy') // ["aaa", index: 1, input: "caaaandy"]
複製代碼
[xyz]
, [^xyz]
[xyz]
:一個字符集合。匹配方括號的中任意字符;
[^xyz]
:一個反向字符集。匹配任何沒有包含在方括號中的字符;
這兩種匹配均可以使用破折號(-)來指定一個字符範圍,特殊符號在字符集中沒有了特殊意義。
例:
function escapeRegExp(string){
return string.replace(/([.*+?^=!:${}()|[\]\/\\])/g, "\\$&");
//$&表示整個被匹配的字符串
}
複製代碼
例子中的 .*+?^=!:${}()
都表示字面量,並無特殊意義
其餘
\b
:匹配一個詞的邊界。一個匹配的詞的邊界並不包含在匹配的內容中。換句話說,一個匹配的詞的邊界的內容的長度是0;
\B
: 匹配一個非單詞邊界;
例:
/\bm/.exec('moon') // ["m", index: 0, input: "moon"]
/\bm/.exec('san moon') // ["m", index: 4, input: "san moon"]
/oo\b/.exec('moon') // null
/\B../.exec('noonday') // ["oo", index: 1, input: "noonday"]
/y\B../.exec('possibly yesterday') // /y\B../.exec('possibly yesterday')
複製代碼
\d
:匹配一個數字,等價於 [0-9]
;
\D
:匹配一個非數字字符,等價於 [^0-9]
;
\f
:匹配一個換頁符 (U+000C);
\n
:匹配一個換行符 (U+000A);
\r
:匹配一個回車符 (U+000D);
\s
:匹配一個空白字符,包括空格、製表符、換頁符和換行符,等價於 [ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]
;
\S
:匹配一個非空白字符,等價於 [^ \f\n\r\t\v\u00a0\u1680\u180e\u2000-\u200a\u2028\u2029\u202f\u205f\u3000\ufeff]
;
\w
:匹配一個單字字符(字母、數字或者下劃線),等價於[A-Za-z0-9_]
;
\W
:匹配一個非單字字符,等價於[^A-Za-z0-9_]
;
g
:全局搜索;
i
:不區分大小寫;
m
:多行搜索;
RegExp
有 exec()
和 test()
方法;
exec
匹配的結果爲:匹配結果、捕獲結果,index
和 input
。
test
匹配的結果爲 true
或 false
,效率比 exec
要高。
String
有 match()
,replace()
,search()
,split()
方法;
match
匹配的結果同 RegExp
的 exec
,replace
根據正則表達式替換,search
查找因此位置,split
根據正則表達式分割字符串。
其中,當 replace
有 function
時,參數說明以下:
index
input
輸入項本文只針對前端正則表達式的簡單歸納,要用好表達式還須要具體的經驗。