簡單的說,正則表達式是一種能夠用於模式匹配和替換的強有力的工具。其做用以下:
測試字符串的某個模式。例如,能夠對一個輸入字符串進行測試,看在該字符串是否存在一個電話號碼模式或一個信用卡號碼模式。這稱爲數據有效性驗證。
替換文本。能夠在文檔中使用一個正則表達式來標識特定文字,而後能夠所有將其刪除,或者替換爲別的文字。
根據模式匹配從字符串中提取一個子字符串。能夠用來在文本或輸入字段中查找特定文字。 html
基本語法 git
在對正則表達式的功能和做用有了初步的瞭解以後,咱們就來具體看一下正則表達式的語法格式。
正則表達式的形式通常以下: 正則表達式
/love/ 其中位於「/」定界符之間的部分就是將要在目標對象中進行匹配的模式。用戶只要把但願查找匹配對象的模式內容放入「/」定界符之間便可。 編程
爲了可以使用戶更加靈活的定製模式內容,正則表達式提供了專門的「元字符」。所謂元字符就是指那些在正則表達式中具備特殊意義的專用字符,能夠用來規定其前導字符(即位於元字符前面的字符)在目標對象中的出現模式。
較爲經常使用的元字符包括: 「+」, 「*」,以及 「?」。 工具
「+」元字符規定其前導字符必須在目標對象中連續出現一次或屢次。 測試
「*」元字符規定其前導字符必須在目標對象中出現零次或連續屢次。 this
「?」元字符規定其前導對象必須在目標對象中連續出現零次或一次。 編碼
下面,就讓咱們來看一下正則表達式元字符的具體應用。 url
/fo+/ 由於上述正則表達式中包含「+」元字符,表示能夠與目標對象中的 「fool」, 「fo」, 或者 「football」等在字母f後面連續出現一個或多個字母o的字符串相匹配。 spa
/eg*/ 由於上述正則表達式中包含「*」元字符,表示能夠與目標對象中的 「easy」, 「ego」, 或者 「egg」等在字母e後面連續出現零個或多個字母g的字符串相匹配。
/Wil?/ 由於上述正則表達式中包含「?」元字符,表示能夠與目標對象中的 「Win」, 或者「Wilson」,等在字母i後面連續出現零個或一個字母l的字符串相匹配。
有時候不知道要匹配多少字符。爲了能適應這種不肯定性,正則表達式支持限定符的概念。這些限定符能夠指定正則表達式的一個給定組件必需要出現多少次才能知足匹配。
{n} n 是一個非負整數。匹配肯定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',可是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配 n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的全部 o。'o{1,}' 等價於 'o+'。'o{0,}' 則等價於 'o*'。
{n,m} m 和 n 均爲非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價於 'o?'。請注意在逗號和兩個數之間不能有空格。
除了元字符以外,用戶還能夠精確指定模式在匹配對象中出現的頻率。例如,/jim {2,6}/ 上述正則表達式規定字符m能夠在匹配對象中連續出現2-6次,所以,上述正則表達式能夠同jimmy或jimmmmmy等字符串相匹配。
在對如何使用正則表達式有了初步瞭解以後,咱們來看一下其它幾個重要的元字符的使用方式。
代碼
1. \s:用於匹配單個空格符,包括tab鍵和換行符;
2. \S:用於匹配除單個空格符以外的全部字符;
3. \d:用於匹配從0到9的數字;
4. \D:用於匹配\d不匹配的字符;
5. \w:用於匹配字母,數字或下劃線字符;
6. \W:用於匹配全部與\w不匹配的字符;
7. :用於匹配除換行符以外的全部字符。
(說明:咱們能夠把\s和\S以及\w和\W看做互爲逆運算)
下面,咱們就經過實例看一下如何在正則表達式中使用上述元字符。
/\s+/ 上述正則表達式能夠用於匹配目標對象中的一個或多個空格字符。
/\d000/ 若是咱們手中有一份複雜的財務報表,那麼咱們能夠經過上述正則表達式垂手可得的查找到全部總額達千元的款項。
除了咱們以上所介紹的元字符以外,正則表達式中還具備另一種較爲獨特的專用字符,即定位符。定位符用於規定匹配模式在目標對象中的出現位置。 較爲經常使用的定位符包括: 「^」, 「$」, 「\b」 以及 「\B」。
代碼
1. 「^」定位符規定匹配模式必須出如今目標字符串的開頭
2. 「$」定位符規定匹配模式必須出如今目標對象的結尾
3. 「\b」定位符規定匹配模式必須出如今目標字符串的開頭或結尾的兩個邊界之一
4. 「\B」定位符則規定匹配對象必須位於目標字符串的開頭和結尾兩個邊界以內,
即匹配對象既不能做爲目標字符串的開頭,也不能做爲目標字符串的結尾。
一樣,咱們也能夠把「^」和「$」以及「\b」和「\B」看做是互爲逆運算的兩組定位符。
舉例來講: /^hell/ 由於上述正則表達式中包含「^」定位符,因此能夠與目標對象中以 「hell」, 「hello」或「hellhound」開頭的字符串相匹配。
/ar$/ 由於上述正則表達式中包含「$」定位符,因此能夠與目標對象中以 「car」, 「bar」或 「ar」 結尾的字符串相匹配。
/\bbom/ 由於上述正則表達式模式以「\b」定位符開頭,因此能夠與目標對象中以 「bomb」, 或 「bom」開頭的字符串相匹配。/man\b/ 由於上述正則表達式模式以「\b」定位符結尾,因此能夠與目標對象中以 「human」, 「woman」或 「man」結尾的字符串相匹配。
爲了可以方便用戶更加靈活的設定匹配模式,正則表達式容許使用者在匹配模式中指定某一個範圍而不侷限於具體的字符。例如:
代碼
1. /[A-Z]/ 上述正則表達式將會與從A到Z範圍內任何一個大寫字母相匹配。
2. /[a-z]/ 上述正則表達式將會與從a到z範圍內任何一個小寫字母相匹配。
3. /[0-9]/ 上述正則表達式將會與從0到9範圍內任何一個數字相匹配。
4. /([a-z][A-Z][0-9])+/ 上述正則表達式將會與任何由字母和數字組成的字符串,如 「aB0」 等相匹配。
這裏須要提醒用戶注意的一點就是能夠在正則表達式中使用 「()」 把字符串組合在一塊兒。「()」符號包含的內容必須同時出如今目標對象中。所以,上述正則表達式將沒法與諸如 「abc」等的字符串匹配,由於「abc」中的最後一個字符爲字母而非數字。
若是咱們但願在正則表達式中實現相似編程邏輯中的「或」運算,在多個不一樣的模式中任選一個進行匹配的話,可使用管道符 「|」。例如:/to|too|2/ 上述正則表達式將會與目標對象中的 「to」, 「too」, 或 「2」 相匹配。
正則表達式中還有一個較爲經常使用的運算符,即否認符 「[^]」。與咱們前文所介紹的定位符 「^」 不一樣,否認符 「[^]」規定目標對象中不能存在模式中所規定的字符串。例如:/[^A-C]/ 上述字符串將會與目標對象中除A,B,和C以外的任何字符相匹配。通常來講,當「^」出如今 「[]」內時就被視作否認運算符;而當「^」位於「[]」以外,或沒有「[]」時,則應當被視作定位符。
最後,當用戶須要在正則表達式的模式中加入元字符,並查找其匹配對象時,可使用轉義符「\」。例如:/Th\*/ 上述正則表達式將會與目標對象中的「Th*」而非「The」等相匹配。
在構造正則表達式以後,就能夠象數學表達式同樣來求值,也就是說,能夠從左至右並按照一個優先級順序來求值。優先級以下:
代碼
1. 1.\ 轉義符
2. 2.(), (?, (?=), [] 圓括號和方括號
3. 3.*, +, ?, {n}, {n,}, {n,m} 限定符
4. 4.^, $, \anymetacharacter 位置和順序
5. 5.|「或」操做
使用實例
在JavaScript 1.2中帶有一個功能強大的RegExp()對象,能夠用來進行正則表達式的匹配操做。其中的test()方法能夠檢驗目標對象中是否包含匹配模式,並相應的返回true或false。
咱們可使用JavaScript編寫如下腳本,驗證用戶輸入的郵件地址的有效性。
代碼
1. <html>
2. <head>
3. <script language="Javascript1.2">
4. <!-- start hiding
5. function verifyAddress(obj)
6. {
7. var email = obj.email.value;
8. var pattern =
9. /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/;
10. flag = pattern.test(email);
11. if(flag)
12. {
13. alert(「Your email address is correct!」);
14. return true;
15. }
16. else
17. {
18. alert(「Please try again!」);
19. return false;
20. }
21. }
22. // stop hiding -->
23. </script>
24. </head>
25. <body>
26. <form onSubmit="return verifyAddress(this);">
27. <input name="email" type="text">
28. <input type="submit">
29. </form>
30. </body>
31. </html>
JS的正則表達式
//校驗是否全由數字組成
代碼
1. function isDigit(s)
2. {
3. var patrn=/^[0-9]{1,20}$/;
4. if (!patrn.exec(s)) return false
5. return true
6. }
//校驗登陸名:只能輸入5-20個以字母開頭、可帶數字、「_」、「.」的字串
代碼
1. function isRegisterUserName(s)
2. {
3. var patrn=/^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$/;
4. if (!patrn.exec(s)) return false
5. return true
6. }
//校驗用戶姓名:只能輸入1-30個以字母開頭的字串
代碼
1. function isTrueName(s)
2. {
3. var patrn=/^[a-zA-Z]{1,30}$/;
4. if (!patrn.exec(s)) return false
5. return true
6. }
7. }}
8.
9. //校驗密碼:只能輸入6-20個字母、數字、下劃線
10. [code]
11. function isPasswd(s)
12. {
13. var patrn=/^(\w){6,20}$/;
14. if (!patrn.exec(s)) return false
15. return true
16. }
//校驗普通電話、傳真號碼:能夠「+」開頭,除數字外,可含有「-」
代碼
1. function isTel(s)
2. {
3. //var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?(\d){1,12})+$/;
4. var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
5. if (!patrn.exec(s)) return false
6. return true
7. }
//校驗手機號碼:必須以數字開頭,除數字外,可含有「-」
代碼
1. function isMobil(s)
2. {
3. var patrn=/^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$/;
4. if (!patrn.exec(s)) return false
5. return true
6. }
//校驗郵政編碼
代碼
1. function isPostalCode(s)
2. {
3. //var patrn=/^[a-zA-Z0-9]{3,12}$/;
4. var patrn=/^[a-zA-Z0-9 ]{3,12}$/;
5. if (!patrn.exec(s)) return false
6. return true
7. }
//校驗搜索關鍵字
代碼
1. function isSearch(s)
2. {
3. var patrn=/^[^`~!@#$%^&*()+=|\\\][\]\{\}:;'\,.<>/?]{1}[^`~!@$%^&()+=|\\\]
4. [\]\{\}:;'\,.<>?]{0,19}$/;
5. if (!patrn.exec(s)) return false
6. return true
7. }
8.
9. function isIP(s) //by zergling
10. {
11. var patrn=/^[0-9.]{1,20}$/;
12. if (!patrn.exec(s)) return false
13. return true
14. }
正則表達式
代碼
1. "^\\d+$" //非負整數(正整數 + 0)
2. "^[0-9]*[1-9][0-9]*$" //正整數
3. "^((-\\d+)|(0+))$" //非正整數(負整數 + 0)
4. "^-[0-9]*[1-9][0-9]*$" //負整數
5. "^-?\\d+$" //整數
6. "^\\d+(file://.//d+)?$" //非負浮點數(正浮點數 + 0)
7. "^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$"
8. //正浮點數
9. "^((-\\d+(file://.//d+)?)|(0+(//.0+)?))$" //非正浮點數(負浮點數 + 0)
10. "^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$"
11. //負浮點數
12. "^(-?\\d+)(file://.//d+)?$" //浮點數
13. "^[A-Za-z]+$" //由26個英文字母組成的字符串
14. "^[A-Z]+$" //由26個英文字母的大寫組成的字符串
15. "^[a-z]+$" //由26個英文字母的小寫組成的字符串
16. "^[A-Za-z0-9]+$" //由數字和26個英文字母組成的字符串
17. "^\\w+$" //由數字、26個英文字母或者下劃線組成的字符串
18. "^[\\w-]+(file://.[//w-]+)*@[//w-]+(//.[//w-]+)+$" //email地址
19. "^[a-zA-z]+://(file://w+(-//w+)*)(//.(//w+(-//w+)*))*(//?//S*)?$" //url
20. "^[A-Za-z0-9_]*$"
補充:
i = 忽略大小寫區別 g = 匹配全部可能的字串 m = 多行匹配