正則表達式

時間 2019-12-14

原文原文鏈接

字符組code

正則	配結果	明
0123456789]	True	在一個字符組裏枚舉合法的全部字符，字符組裏的任意一個字符和"待匹配字符"相同都視爲能夠匹配
0123456789]	alse	於字符組中沒有"a"字符，因此不能匹配
0-9]	rue	能夠用-表示範圍,[0-9]就和[0123456789]是一個意思
a-z]	rue	樣的若是要匹配全部的小寫字母，直接用[a-z]就能夠表示
A-Z]	rue	A-Z]就表示全部的大寫字母
0-9a-fA-F]	rue	以匹配數字，大小寫形式的a～f，用來驗證十六進制字符

字符ip

量詞字符串

. ^ $get

正則	待匹配字符	匹配結果	說明
海.	海燕海嬌海東	海燕海嬌海東	匹配全部"海."的字符
^海.	海燕海嬌海東	海燕	只從開頭匹配"海."
海.$	海燕海嬌海東	海東	只匹配結尾的"海.$"

正則	待匹配字符	匹配結果	說明
李.?	李傑和李蓮英和李二棍子	李傑李蓮李二	表示重複零次或一次，即只匹配"李"後面一個任意字符
李.*	李傑和李蓮英和李二棍子	李傑和李蓮英和李二棍子	表示重複零次或屢次，即匹配"李"後面0或多個任意字符
李.+	李傑和李蓮英和李二棍子	李傑和李蓮英和李二棍子	表示重複一次或屢次，即只匹配"李"後面1個或多個任意字符
李.{1,2}	李傑和李蓮英和李二棍子	李傑和李蓮英李二棍	1,2}匹配1到2次任意字符

注意：前面的*,+,?等都是貪婪匹配，也就是儘量匹配，後面加?號使其變成惰性匹配

正則	待匹配字符	匹配結果	說明
李.*?	李傑和李蓮英和李二棍子	李李李	惰性匹配

字符集［］［^］class

正則	待匹配字符	匹配結果	說明
李[傑蓮英二棍子]*	李傑和李蓮英和李二棍子	李傑李蓮英李二棍子	示匹配"李"字後面[傑蓮英二棍子]的字符任意次
李[^和]*	李傑和李蓮英和李二棍子	李傑李蓮英李二棍子	示匹配一個不是"和"的字符任意次
[\d]	456bdha3	4 5 6 3	示匹配任意一個數字，匹配到4個結果
[\d]+	456bdha3	456 3	示匹配任意個數字，匹配到2個結果

分組 ()與或｜［^］

正則	待匹配字符	匹配結果	說明
^[1-9]\d{13,16}[0-9x]$	110101198001017032	110101198001017032	表示能夠匹配一個正確的身份證號
^[1-9]\d{13,16}[0-9x]$	1101011980010170	1101011980010170	示也能夠匹配這串數字，但這並非一個正確的身份證號碼，它是一個16位的數字
^[1-9]\d{14}(\d{2}[0-9x])?$	1101011980010170	False	在不會匹配錯誤的身份證號了()表示分組，將\d{2}[0-9x]分紅一組，就能夠總體約束他們出現的次數爲0-1次
^([1-9]\d{16}[0-9x]\|[1-9]\d{14})$	110105199812067023	110105199812067023	示先匹配[1-9]\d{16}[0-9x]若是沒有匹配上就匹配[1-9]\d{14}

轉義符
在正則表達式中，有不少有特殊意義的是元字符，好比\n和\s等，若是要在正則中匹配正常的"\n"而不是"換行符"就須要對"\"進行轉義，變成'\\'。

正則	待匹配字符	匹配結果	說明
\n	\n	False	爲在正則表達式中\是有特殊意義的字符，因此要匹配\n自己，用表達式\n沒法匹配
\\n	\n	True	義\以後變成\，便可匹配
"\\\\n"	'\\n'	True	果在python中，字符串中的''也須要轉義，因此每個字符串''又須要轉義一次

貪婪匹配

貪婪匹配：在知足匹配時，匹配儘量長的字符串，默認狀況下，採用貪婪匹配

正則	待匹配字符	匹配結果	說明
<.*>	<script>...<script>	<script>...<script>	認爲貪婪匹配模式，會匹配儘可能長的字符串
<.*?>	<script>...<script>	<script>...<script>	上？爲將貪婪匹配模式轉爲非貪婪匹配模式，會匹配儘可能短的字符串