grep與正則達式

時間 2019-11-06

標籤 grep 正則欄目正則表達式简体版

原文原文鏈接

grep是一個行編輯器，它的默認動做是搜索與給定模式匹配的行顯示到屏幕上來。它的變種程序包括egrep和fgrep。正則表達式

正則表達式是用戶定義的、Linux工具用來過濾文本的模式模板。正則表達式利用元字符來表示數據流中的一個或多個字符。shell

正則表達式（Regual Expression，REGEXP）包括BRE和ERE兩種，BRE就是基本正則表達式，而ERE是擴展正則表達式。bash

grep使用的元字符是BRE，egrep使用的元字符是ERE，而fgrep不使用元字符。而這三個命令可使用不一樣的選項進行互通。接下來，咱們來看看grep的用法。編輯器

1、grepide

1. 格式工具

grep [options] PATTERN [FILE...]spa

2. 選項字符串

-o：只顯示匹配的行中與PATTERN相匹配的部分。it

-i：忽略PATTERN和輸入文件中大小寫的區別io

-v：反選，只顯示沒有被PATTERN匹配到的行

-q：靜默模式，找到匹配的內容，則命令的執行狀態返回值爲0，不然爲非0。

-A NUM：打印緊隨匹配的行以後的下文NUM行。

-B NUM：打印緊隨匹配的行以前的上文NUM行。

-C NUM：打印匹配出來的行的上下文各NUM行。

2、基本正則表達式

類型	元字符	解釋
字符匹配	.	匹配任意單個字符
	[]	匹配指定範圍內的任意單個字符
	[^]	匹配指定範圍外的單個字符

匹配次數	*	匹配其前的字符任意次，0次，1次或者屢次
	.*	匹配任意長度的任意字符
	\?	匹配其前的字符0次或者1次，即其前面的字符可有可元
	\+	匹配其前的字符1次或者屢次，即其前面的字符至少出現1次
	\{m\}	匹配其前的字符m次，精確匹配
	\{m,n\}	匹配其前的字符至少m次，至多n次
	\{0,n\}	匹配其前的字符最多n次
	\{m,\}	匹配其前的字符最少m次
位置錨定	^	錨定行首，寫在模式的最左側，指定的字符串只能出如今行首
	$	錨定行尾，寫在模式的最右側
	^PATTERN$	用PATTERN來匹配整行
	^$	表示空行，連空格都不能包含，不包括任意字符
	^[[:spaces:]]*	表示空行或者包括空白字符的行
	\<PATTERN	錨定詞首
	\bPATTERN	錨定詞首
	PATTERN\>	錨定詞尾
	\<PATTERN>\	精確錨定單詞

分組及引用	$PATTERN$	將一個或者多個字符捆綁在一塊兒，看成一個總體進行處理；
分組括號中的模式匹配到的內容會被正則表達式引擎自動記錄於內部的變量中，這些變量爲: \1: 模式從左側起，第一個左括號以及與之匹配到的右括號之間的字符 \2:模式從左側起，第二個左括號以及與之匹配到的右括號之間的字符

3、擴展正則表達式

類型	元字符	解釋
字符匹配	.	匹配任意單個字符
	[]	匹配指定範圍內的任意單個字符
	[^]	匹配指定範圍外的單個字符

匹配次數	*	匹配其前的字符任意次，0次，1次或者屢次
	.*	匹配任意長度的任意字符
	?	匹配其前的字符0次或者1次，即其前面的字符可有可元
	+	匹配其前的字符1次或者屢次，即其前面的字符至少出現1次
	{m}	匹配其前的字符m次，精確匹配
	{m,n}	匹配其前的字符至少m次，至多n次
	{0,n}	匹配其前的字符最多n次
	{m,}	匹配其前的字符最少m次
位置錨定	^	錨定行首，寫在模式的最左側，指定的字符串只能出如今行首
	$	錨定行尾，寫在模式的最右側
	^PATTERN$	用PATTERN來匹配整行
	^$	表示空行，連空格都不能包含，不包括任意字符
	^[[:spaces:]]*	表示空行或者包括空白字符的行
	\<PATTERN	錨定詞首
	\bPATTERN	錨定詞首
	PATTERN\>	錨定詞尾
	\<PATTERN>\	精確錨定單詞
或	\|	或，以\|爲分隔，表示或者爲\|左邊，或者爲\|右邊 C\|cat表示C或者cat
分組及引用	(PATTERN)	將一個或者多個字符捆綁在一塊兒，看成一個總體進行處理；
分組括號中的模式匹配到的內容會被正則表達式引擎自動記錄於內部的變量中，這些變量爲: \1: 模式從左側起，第一個左括號以及與之匹配到的右括號之間的字符 \2:模式從左側起，第二個左括號以及與之匹配到的右括號之間的字符