LINUX正則表達式(Regular Expression)主要聽從POSIX BRE或者POSIX ERE標準。什麼是POSIX呢,POSIX Portable Operating System Interface 可移植操做系統接口ERE是BRE的擴展版本,具體更強的處理能力,並增長了一些元字符(metacharactor)。git
BRE主要的能力集有:正則表達式
1) 普通字符(Literal text),如a,b,c等ide
2)非打印字符,包括TAB,回車,換行,回車換行(WINDOWS)spa
3)任意字符.操作系統
4)字符集,包括單詞型字符([[:alnum:]]),非單詞型字符([^[:alnum:]]),數字([[:digit:]]),非數字([^[:alnum:]]),空格、TAB、換行等空白字符([[:space:]])以及非空白字符([^[:space:]])orm
5)邊緣匹配符,無論是BRE仍是ERE,都只支持匹配行首或行尾,不像perl,還能夠匹配單詞首和單詞尾接口
6)匹配重複次數(Quantifier/Repetition)it
7)分組及後向引用io
8)多項匹配(Alteration),使用元字符|,該特性只ERE支持,BRE沒有此功能table
BRE與ERE彷佛對ASCII和UNICODE是否都支持尚待確認;
正前向查找和負前向查找不支持;
正後向查找和負後向查找不支持;
BRE與ERE在能力上區別僅在多項匹配的能力上,其餘方面沒有大的差異,主要的區別體如今元字符上。
BRE只定義了4組元字符:
[] 用於在多個字符中選定一個字符進行匹配,[]內能夠有-以示範圍,但-自己不是元字符
. 用於匹配任意字符
^ 用於匹配時表示「非」的含義,還有一個用法是匹配行首
$ 用於匹配行尾
ERE在此基礎上增長了3組元字符的定義:
{} 用於表示重複匹配的次數。BRE中只將{}看成普通字符對待,要使用此功能必須加\進行轉義,即「\{\}」
() 用於分組。BRE中只將()看成普通字符對待,要使用此功能必須加\進行轉義,即「\(\)」
| 徹底爲ERE新增的多項匹配能力定義的,BRE無多項匹配能力,只將|做普通字符對待