快速掌握grep命令及正則表達式

Linux系統自帶了支持拓展正則表達式的 GNU 版本 grep 工具,全部的Linux發行版中均默認安裝grep ,grep 命令被用來檢索一臺服務器或工做站上任何位置的文本信息,如何在 Linux 系統和類 Unix 的操做系統中使用帶正則表達式的 grep 命令呢?linux

快速瞭解正則表達式git

一、如何匹配你要查找的內容?正則表達式

正則表達式只不過是每一個輸入行匹配的模式。express

在 ‘/etc/passswd’ 中檢索 ‘vivek’ 。bash

grep vivek /etc/passwd

輸出結果案例:服務器

vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh
gitevivek:x:1002:1002::/home/gitevivek:/bin/sh

在任何狀況下都搜索 ‘vivek’ (即不區分大小):工具

grep -i -w vivek /etc/passwd

不區分大小寫地檢索 ‘vivek’ 和 ‘raj’ :測試

grep -E -i -w 'vivek|raj' /etc/passwd

在最後一個例子中,使用了擴展正則表達式的模式。this

固定檢索內容的位置:
你可使用 ^ 和 $ 符號強制一個正則表達式分別匹配一行的開始或結束的位置。下面的示例顯示以 ‘vivek’ 開頭的文本。spa

grep ^vivek /etc/passwd

輸出結果示例:

vivek:x:1000:1000:Vivek Gite,,,:/home/vivek:/bin/bash
vivekgite:x:1001:1001::/home/vivekgite:/bin/sh

你能夠只顯示以 vivek 開頭的文本行。舉例說就是不顯示 vivekgite , vivekg 這樣單詞開頭的。

grep -w ^vivek /etc/passwd

檢索以 ‘foo’ 結尾的文本格式:

grep 'foo$' FILENAME

你還能夠用下面這樣的方式搜索空白行:

grep '^$' FILENAME

二、如何匹配具體字符?

匹配 ‘Vivek’ 或 ‘vivek’ :

grep '[vV]ivek' FILENAME

或者能夠這樣:

grep '[vV][iI][Vv][Ee][kK]' FILENAME

你能夠匹配數字(例如匹配 vivek1 或 Vivek2 ):

grep -w '[vV]ivek[0-9]' FILENAME

你能夠匹配兩位數(例如匹配 foo11 , foo12 ):

grep 'foo[0-9][0-9]' FILENAME

不單單是數字,你能夠匹配字母:

grep '[A-Za-z]' FILENAME

顯示全部包含 「w」 或 「n」 字母的文本行:

grep [wn] FILENAME

在括號內的表達式中,在「 [: 」和「 :] 」中所附的字符類的名稱:表明屬於該類的全部字符的列表。標準字符類名稱:

[:alnum:] – 字母數字字符。
[:alpha:] – 字母順序
[:blank:] – 空格和製表符。
[:digit:] – 數字: ‘0 1 2 3 4 5 6 7 8 9’。
[:lower:] – 小寫字母:‘a b c d e f ‘。
[:space:] – 特殊字符:製表符,換行符,垂直製表符、換頁,回車,和空間。
[:upper:] – 大寫字母:‘A B C D E F G H I J K L M N O P Q R S T U V W X Y Z’。

在下面這個例子中,匹配全部大寫字母:

grep '[:upper:]' FILENAME

三、如何使用通配符?

你能夠用 「.」 來代替單個字符。在下面的例子中,查詢了全部以字母 「b」 開頭、字母 「t」 結尾的三個字符的單詞。

grep '\<b.t\>' FILENAME

在上面的例子中:

\< 在單詞的開始位置匹配空格字符串
\> 在單詞的結尾匹配空格字符串

檢索並輸出全部兩個字母的結果:

grep '^..$' FILENAME

檢索並顯示全部以 ‘.’ 和數字開頭的結果:

grep '^\.[0-9]' FILENAME
轉義字符’.’

下面的正則表達式查找 IP 地址 192.168.1.254 將不能得到預期的結果:

grep '192.168.1.254' /etc/hosts

其中三個點都須要被轉義:

grep '192\.168\.1\.254' /etc/hosts

如下示例將只匹配一個地址:

egrep '[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}' FILENAME

如下將不分大小寫地匹配單詞 Linux 或 Unix :

egrep -i '^(linux|unix)' FILENAME

深刻探索 grep 高級查找模式

一、如何檢索一個具備以 ‘-‘ 開頭的的模式?

使用 -e 選項搜索全部匹配 ‘–test–‘ 的結果。grep 會嘗試把 ‘–test–‘ 做爲一個選項解析:

grep -e '--test--' FILENAME

二、如何在grep中使用 OR 的邏輯運算 ?

grep -E 'word1|word2' FILENAME### OR ###egrep 'word1|word2' FILENAME

或者能夠這樣作

grep 'word1\|word2' FILENAME

三、如何在grep中使用 AND 的邏輯運算 ?

按照下面的語法顯示全部包含了單詞 ‘word1′ 和 ‘word2′ 的結果:

grep 'word1' FILENAME | grep 'word2'

或者能夠這樣:

grep 'foo.*bar\|word3.*word4' FILENAME

四、如何測試序列?

你可使用下面的語法測試一個字符在序列中的重複的次數:

{N}
{N,}
{min,max}

匹配包含兩個字母 v 的字符串結果:

egrep "v{2}" FILENAME

下面的例子中將檢索文件內包含 「col」 和 「cool」 的字符串結果:

egrep 'co{1,2}l' FILENAME

下面的例子中將匹配至少含有3個字母 c 的結果:

egrep 'c{3,}' FILENAME

下面的示例將匹配 「91-1234567890″ 格式的手機號碼(即 「兩位數字-十位數字」)

grep "[[:digit:]]\{2\}[ -]\?[[:digit:]]\{10\}" FILENAME

五、如何使 grep 的輸出結果高亮標註?

使用下面例子的語法:

grep --color regex FILENAME

六、如何使 grep 的輸出只顯示匹配的部分而不是整行?

使用下面例子的語法:

grep -o regex FILENAME

正則表達式操做符總結

正則表達式:操做符 含義

. 匹配任何單個字符。
? 匹配前一個字符0次或1次。
* 匹配前一個字符≥0次。
+ 匹配前一個字符≥1次。
{N} 匹配前一個字符N次。
{N,} 匹配前一個字符≥m次。
{N,M} 匹配前一個字符 N 到 M次。
– 若是在列表中的某個列表或某個範圍內的結束點,表示該範圍。
^ 開始標記,表示在開始位置匹配一個空字符串。也表示不在列表的範圍內的字符。
$ 結束標記。匹配一個空的字符串。
\b 單詞鎖定符。在一個單詞的邊緣位置匹配空字符串。
\B 在一個單詞的非邊緣位置匹配空字符串。
\< 匹配單詞開始的空字符串。
\> 匹配單詞結尾的空字符串。

關於 grep 和 egrep

egrep 即 grep -E ,它把模式做爲一個擴展的正則表達式解釋。grep 幫助文檔中這樣定義:

In basic regular expressions the meta-characters ?, +, {, |, (, and ) lose their special meaning; instead use the backslashed versions \?, \+, \{,\|, \(, and \).
       Traditional egrep did not support the { meta-character, and some egrep implementations support \{ instead, so portable scripts should avoid  {  in
       grep -E patterns and should use [{] to match a literal {.
       GNU grep -E attempts to support traditional usage by assuming that { is not special if it would be the start of an invalid interval specification.
       For example, the command grep -E '{1' searches for the two-character string {1 instead of reporting a syntax  error  in  the  regular  expression.
       POSIX.2 allows this behavior as an extension, but portable scripts should avoid it.

免費提供最新Linux技術教程書籍,爲開源技術愛好者努力作得更多更好:http://www.linuxprobe.com/

相關文章
相關標籤/搜索