【正則】基本知識點

時間 2019-12-08

標籤正則基本知識欄目正則表達式简体版

原文原文鏈接

【04】正則的概念

01，

正則表達式，就是用匹配符來在字符串中尋找內容。

和Date同樣，它只是一種具備實用API的特殊對象。

02， RegExp 對象（英語：Regular Expression，在代碼中常簡寫爲regex、regexp或RE）表示正則表達式，它是對字符串執行模式匹配的工具。

【05】非打印字符

轉義序列：

字符描述

\cx 匹配由x指明的控制字符。例如， \cM 匹配一個 Control-M 或回車符。x 的值必須爲 A-Z 或 a-z 之一。不然，將 c 視爲一個原義的 'c' 字符。

\f 匹配一個換頁符。等價於 \x0c 和 \cL。

\n 匹配一個換行符。等價於 \x0a 和 \cJ。

\r 匹配一個回車符。等價於 \x0d 和 \cM。

\s 匹配任何空白字符，包括空格、製表符、換頁符等等。等價於 [ \f\n\r\t\v]。

\S 匹配任何非空白字符。等價於 [^ \f\n\r\t\v]。

\t 匹配一個製表符。等價於 \x09 和 \cI。

\v 匹配一個垂直製表符。等價於 \x0b 和 \cK。

換行符就是'\n',ASCII編碼爲10(十六進制0x0A)的字符。

特殊字符

所謂特殊字符，就是一些有特殊含義的字符，如上面說的"*.txt"中的*，簡單的說就是表示任何字符串的意思。若是要查找文件名中有*的文件，則須要對*進行轉義，即在其前加一個\。

若要匹配這些特殊字符，必須首先使字符"轉義"，即，將反斜槓字符 (\) 放在它們前面。

下表列出了正則表達式中的特殊字符：

特別字符描述

$ 匹配輸入字符串的結尾位置。若是設置了 RegExp 對象的 Multiline 屬性，則 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符自己，請使用 \$。

( ) 標記一個子表達式的開始和結束位置。子表達式能夠獲取供之後使用。要匹配這些字符，請使用 $ 和 $。

* 匹配前面的子表達式零次或屢次。要匹配 * 字符，請使用 \*。

+ 匹配前面的子表達式一次或屢次。要匹配 + 字符，請使用 \+。

. 匹配除換行符 \n以外的任何單字符。要匹配 .，請使用 \。

[ 標記一箇中括號表達式的開始。要匹配 [，請使用 \[。

? 匹配前面的子表達式零次或一次，或指明一個非貪婪限定符。要匹配 ? 字符，請使用 \?。

\ 將下一個字符標記爲或特殊字符、或原義字符、或向後引用、或八進制轉義符。例如， 'n' 匹配字符 'n'。'\n' 匹配換行符。序列 '\\' 匹配 "\"，而 '\(' 則匹配 "("。

^ 匹配輸入字符串的開始位置，除非在方括號表達式中使用，此時它表示不接受該字符集合。要匹配 ^ 字符自己，請使用 \^。

{ 標記限定符表達式的開始。要匹配 {，請使用 \{。

| 指明兩項之間的一個選擇。要匹配 |，請使用 \|。

【06】運算符優先級

正則表達式從左到右進行計算，並遵循優先級順序。

相同優先級的從左到右進行運算，不一樣優先級的運算先高後低。

下表從最高到最低說明了各類正則表達式運算符的優先級順序：

運算符	描述
\	轉義符
(), (?:), (?=), []	圓括號和方括號
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \任何元字符、任何字符	定位點和序列（即：位置和順序）
\|	替換，"或"操做字符具備高於替換運算符的優先級，使得"m\|food"匹配"m"或"food"。若要匹配"mood"或"food"，請使用括號建立子表達式，從而產生"(m\|f)ood"。