LINUX正則表達式特性及BRE與ERE的區別

LINUX正則表達式特性及BRE與ERE的區別

LINUX正則表達式(Regular Expression)主要聽從POSIX BRE或者POSIX ERE標準。什麼是POSIX呢,POSIX Portable Operating System Interface 可移植操做系統接口ERE是BRE的擴展版本,具體更強的處理能力,並增長了一些元字符(metacharactor)。git

BRE主要的能力集有:正則表達式

1) 普通字符(Literal text),如a,b,c等ide

2)非打印字符,包括TAB,回車,換行,回車換行(WINDOWS)spa

3)任意字符.操作系統

4)字符集,包括單詞型字符([[:alnum:]]),非單詞型字符([^[:alnum:]]),數字([[:digit:]]),非數字([^[:alnum:]]),空格、TAB、換行等空白字符([[:space:]])以及非空白字符([^[:space:]])orm

5)邊緣匹配符,無論是BRE仍是ERE,都只支持匹配行首或行尾,不像perl,還能夠匹配單詞首和單詞尾接口

6)匹配重複次數(Quantifier/Repetition)it

7)分組及後向引用io

8)多項匹配(Alteration),使用元字符|,該特性只ERE支持,BRE沒有此功能table

BRE與ERE彷佛對ASCII和UNICODE是否都支持尚待確認;

正前向查找和負前向查找不支持;

正後向查找和負後向查找不支持;


BRE與ERE在能力上區別僅在多項匹配的能力上,其餘方面沒有大的差異,主要的區別體如今元字符上。

BRE只定義了4組元字符:

[]       用於在多個字符中選定一個字符進行匹配,[]內能夠有-以示範圍,但-自己不是元字符

.        用於匹配任意字符

^       用於匹配時表示「非」的含義,還有一個用法是匹配行首

$       用於匹配行尾

ERE在此基礎上增長了3組元字符的定義:

{}      用於表示重複匹配的次數。BRE中只將{}看成普通字符對待,要使用此功能必須加\進行轉義,即「\{\}」

()      用於分組。BRE中只將()看成普通字符對待,要使用此功能必須加\進行轉義,即「\(\)」

|       徹底爲ERE新增的多項匹配能力定義的,BRE無多項匹配能力,只將|做普通字符對待

相關文章
相關標籤/搜索