正則grep (資源)

正則三劍客

grep : 文本過濾工具(模式:pattern)工具;php

sed : stream editor,流編輯器;文本編輯工具;

awk : Linux上的實現爲gawk,文本報告生成器(格式化文本);html

正則表達式 :Regual Expression , REGEXPjava

     由一類特殊字符及文本字符所編寫的模式,其中有些字符表示其字面意義,而是用於表示控制或通配的功能;node

     種類 : python

            基本正則表達式 : BRElinux

            擴展正則表達式 : EREgit

基本正則表達式元字符 : 正則表達式

    字符匹配 : redis

          . :匹配任意單個字符;shell

          [] :匹配指定範圍內的任意單個字符;

          [] : 匹配指定範圍外的任意單個字符;

一、 正則介紹_grep上

正則就是一串有規律的字符串,掌握好正則對於編寫shell腳本有很大幫助,各類編程語言中都有正則,原理是同樣的。本章將要學習grep/egrp、sed、awk

1.做用
Linux系統中grep命令是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹 配的行打印出來。grep全稱是Global Regular Expression Print,表示全局正則表達式版本,它的使用權限是全部用戶。
2.格式
grep [options]
3.主要參數
[options]主要參數:

-o 只按行顯示匹配的字符
-c 只輸出匹配行的數目
-n 顯示匹配行的行號
-v 顯示不包含匹配文本的行
-i 不區分大小寫 (grep是大小寫敏感的)
-R 文件夾下遞歸搜索
-l 只顯示匹配的文件名 
-H 顯示文件名
-A NUM(after)顯示匹配的後幾行
-B NUM(before)顯示匹配的前幾行
-C NUM顯示匹配的先後幾行 
–color 標出顏色
pattern正則表達式主要參數:
\: 忽略正則表達式中特殊字符的原有含義。
^:匹配正則表達式的開始行。
$: 匹配正則表達式的結束行。
\<:從匹配正則表達 式的行開始。
\>:到匹配正則表達式的行結束。
[ ]:單個字符,如[A]即A符合要求 。
[ - ]:範圍,如[A-Z],即A、B、C一直到Z都符合要求 。
。:全部的單個字符。
* :有字符,長度能夠爲0。
4.grep命令使用簡單實例
$ grep ‘test’ d*
顯示全部以d開頭的文件中包含 test的行。
$ grep ‘test’ aa bb cc
顯示在aa,bb,cc文件中匹配test的行。
$ grep ‘[a-z]\{5\}’ aa
顯示全部包含每一個字符串至少有5個連續小寫字符的字符串的行。
$ grep ‘w\(es\)t.*\1′ aa
若是west被匹配,則es就被存儲到內存中,並標記爲1,而後搜索任意個字符(.*),這些字符後面緊跟着 另一個es(\1),找到就顯示該行。若是用egrep或grep -E,就不用」\」號進行轉義,直接寫成’w(es)t.*\1′就能夠了。
5.grep命令使用複雜實例
假設您正在’/usr/src/Linux/Doc’目錄下搜索帶字符 串’magic’的文件:
$ grep magic /usr/src/Linux/Doc/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?
其中文件’sysrp.txt’包含該字符串,討論的是 SysRQ 的功能。
默認狀況下,’grep’只搜索當前目錄。若是 此目錄下有許多子目錄,’grep’會以以下形式列出:
grep: sound: Is a directory
這可能會使’grep’ 的輸出難於閱讀。這裏有兩種解決的辦法:
明確要求搜索子目錄:grep -r
或忽略子目錄:grep -d skip
若是有不少 輸出時,您能夠經過管道將其轉到’less’上閱讀:
$ grep magic /usr/src/Linux/Documentation/* | less
這樣,您就能夠更方便地閱讀。
有一點要注意,您必需提供一個文件過濾方式(搜索所有文件的話用 *)。若是您忘了,’grep’會一直等着,直到該程序被中斷。若是您遇到了這樣的狀況,按 <CTRL c> ,而後再試。
下面還有一些有意思的命令行參數:
grep -i pattern files :不區分大小寫地搜索。默認狀況區分大小寫,
grep -l pattern files :只列出匹配的文件名,
grep -L pattern files :列出不匹配的文件名,
grep -w pattern files :只匹配整個單詞,而不是字符串的一部分(如匹配’magic’,而不是’magical’),
grep -C number pattern files :匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。
grep -n pattern files  便可顯示行號信息
grep -c pattern files  便可查找總行數
這裏還有些用於搜索的特殊符號:
\< 和 \> 分別標註單詞的開始與結尾。
例如:
grep man * 會匹配 ‘Batman’、’manic’、’man’等,
grep ‘\<man’ * 匹配’manic’和’man’,但不是’Batman’,
grep ‘\<man\>’ 只匹配’man’,而不是’Batman’或’manic’等其餘的字符串。
‘^’:指匹配的字符串在行首,
‘$’:指匹配的字符串在行 尾,

Grep 命令 用法大全
一、 參數: 
-I :忽略大小寫 
-c :打印匹配的行數 
-l :從多個文件中查找包含匹配項 
-v :查找不包含匹配項的行 
-n:打印包含匹配項的行和行標 

二、RE(正則表達式) 
\ 忽略正則表達式中特殊字符的原有含義 
^ 匹配正則表達式的開始行 
$ 匹配正則表達式的結束行 
\< 從匹配正則表達式的行開始 
\> 到匹配正則表達式的行結束 
[ ] 單個字符;如[A] 即A符合要求 
[ - ] 範圍 ;如[A-Z]即A,B,C一直到Z都符合要求 
. 全部的單個字符 
* 全部字符,長度能夠爲0 

三、舉例 
# ps -ef | grep in.telnetd 
root 19955 181 0 13:43:53 ? 0:00 in.telnetd 

# more size.txt size文件的內容 
b124230 
b034325 
a081016 
m7187998 
m7282064 
a022021 
a061048 
m9324822 
b103303 
a013386 
b044525 
m8987131 
B081016 
M45678 
B103303 
BADc2345 

# more size.txt | grep '[a-b]' 範圍 ;如[A-Z]即A,B,C一直到Z都符合要求 
b124230 
b034325 
a081016 
a022021 
a061048 
b103303 
a013386 
b044525 
# more size.txt | grep '[a-b]'* 
b124230 
b034325 
a081016 
m7187998 
m7282064 
a022021 
a061048 
m9324822 
b103303 
a013386 
b044525 
m8987131 
B081016 
M45678 
B103303 
BADc2345 

# more size.txt | grep 'b' 單個字符;如[A] 即A符合要求 
b124230 
b034325 
b103303 
b044525 
# more size.txt | grep '[bB]' 
b124230 
b034325 
b103303 
b044525 
B081016 
B103303 
BADc2345 

# grep 'root' /etc/group 
root::0:root 
bin::2:root,bin,daemon 
sys::3:root,bin,sys,adm 
adm::4:root,adm,daemon 
uucp::5:root,uucp 
mail::6:root 
tty::7:root,tty,adm 
lp::8:root,lp,adm 
nuucp::9:root,nuucp 
daemon::12:root,daemon 

# grep '^root' /etc/group 匹配正則表達式的開始行 
root::0:root 

# grep 'uucp' /etc/group 
uucp::5:root,uucp 
nuucp::9:root,nuucp 

# grep '\<uucp' /etc/group 
uucp::5:root,uucp 

# grep 'root$' /etc/group 匹配正則表達式的結束行 
root::0:root 
mail::6:root 

# more size.txt | grep -i 'b1..*3' -i :忽略大小寫 

b124230 
b103303 
B103303 

# more size.txt | grep -iv 'b1..*3' -v :查找不包含匹配項的行 

b034325 
a081016 
m7187998 
m7282064 
a022021 
a061048 
m9324822 
a013386 
b044525 
m8987131 
B081016 
M45678 
BADc2345 

# more size.txt | grep -in 'b1..*3' 
1:b124230 
9:b103303 
15:B103303 

# grep '$' /etc/init.d/nfs.server | wc -l 
128 
# grep '\$' /etc/init.d/nfs.server | wc –l 忽略正則表達式中特殊字符的原有含義 

15 
# grep '\$' /etc/init.d/nfs.server 
case "$1" in 
>/tmp/sharetab.$$ 
[ "x$fstype" != xnfs ] && 
echo "$path\t$res\t$fstype\t$opts\t$desc" 
>>/tmp/sharetab.$$ 
/usr/bin/touch -r /etc/dfs/sharetab /tmp/sharetab.$$ 
/usr/bin/mv -f /tmp/sharetab.$$ /etc/dfs/sharetab 
if [ -f /etc/dfs/dfstab ] && /usr/bin/egrep -v '^[ ]*(#|$)' 
if [ $startnfsd -eq 0 -a -f /etc/rmmount.conf ] && 
if [ $startnfsd -ne 0 ]; then 
elif [ ! -n "$_INIT_RUN_LEVEL" ]; then 
while [ $wtime -gt 0 ]; do 
wtime=`expr $wtime - 1` 
if [ $wtime -eq 0 ]; then 
echo "Usage: $0 { start | stop }" 

# more size.txt 

the test file 
their are files 
The end 

# grep 'the' size.txt 
the test file 
their are files 

# grep '\<the' size.txt 
the test file 
their are files 

# grep 'the\>' size.txt 
the test file 

# grep '\<the\>' size.txt 
the test file 

# grep '\<[Tt]he\>' size.txt 
the test file

==================================================================

1,簡介
使用正則表達式的一個多用途文本搜索工具.這個php?name=%C3%FC%C1%EE" onclick="tagshow(event)" class="t_tag">命令原本是ed行編輯器中的一個php?name=%C3%FC%C1%EE" onclick="tagshow(event)" class="t_tag">命令/過濾器:
        g/re/p -- global - regular expression - print.
基本格式
grep pattern [file...]
(1)grep 搜索字符串 [filename]
(2)grep 正則表達式 [filename]
在文件中搜索全部 pattern 出現的位置, pattern 既能夠是要搜索的字符串,也能夠是一個正則表達式.
注意:在輸入要搜索的字符串時最好使用雙引號/而在模式匹配使用正則表達式時,注意使用單引號

2,grep的選項
    -c 只輸出匹配行的計數
    -i 不區分大小寫(用於單字符)
    -n 顯示匹配的行號
    -v 不顯示不包含匹配文本的因此有行
    -s 不顯示錯誤信息
    -E 使用擴展正則表達式
    更多的選項請查看:man grep

3,經常使用grep實例

(1)多個文件查詢
    grep "sort" *.doc               #見文件名的匹配

(2)行匹配:輸出匹配行的計數
    grep -c "48" data.doc           #輸出文檔中含有48字符的行數

(3)顯示匹配行和行數
    grep -n "48" data.doc           #顯示全部匹配48的行和行號
 
(4)顯示非匹配的行  
    grep -vn "48" data.doc          #輸出全部不包含48的行

(5)大小寫敏感
    grep -i "ab" data.doc           #輸出全部含有ab或Ab的字符串的行

4, 正則表達式的應用

(1)正則表達式的應用 (注意:最好把正則表達式用單引號括起來)
    grep '[239].' data.doc         #輸出全部含有以2,3或9開頭的,而且是兩個數字的行

(2)不匹配測試
    grep '^[^48]' data.doc         #不匹配行首是48的行

(3)使用擴展模式匹配
    grep -E '219|216' data.doc

(4) ...
    這須要在實踐中不斷應用和總結,熟練掌握正則表達式。

5, 使用類名
可使用國際模式匹配的類名:
[[:upper:]]   [A-Z]
[[:lower:]]   [a-z]
[[:digit:]]   [0-9]
[[:alnum:]]   [0-9a-zA-Z]
[[:space:]]   空格或tab
[[:alpha:]]   [a-zA-Z]

(1)使用
    grep '5[[:upper:]][[:upper:]]' data.doc              #查詢以5開頭以兩個大寫字母結尾的行

 

grep

grep [-cinvABC]'word'filename

-c                       行數

-i                        不區分大小寫

-n                      顯示行號

-v                      取反

-r                       #遍歷全部的子目錄

-A                     後面跟數字,過濾出符合要求的行以及下面n行

-B                     同上,過濾處於符合要求的行以及上面n行

-C                    同上,同時過濾處於符合要求的行以及上下各n行

實例:

過濾nologin在passwd文件中。使用which grep查看命令的別名。

過濾掉不含有nologin的行。

列出來全部的含有root的目錄或文件。

使用重定向,把root導進/tmp/grep.log,而後查找passwd文件,

-A列出來關鍵的行rootr以後,-A2還列出來底下的的兩行。

-C列出來上下兩行

 

不加參數

grep最簡單的用法就是不加任何參數,好比說,咱們想要在grep.txt文件中找到含有字符串"hello"的全部行,那麼咱們能夠

-n

-n參數可讓你在顯示所匹配到的內容時同時顯示行號,仍是在grep.txt文件中找到含有字符串"hello"的全部行 ,此次咱們加了-nc參數,看看和上面的輸出有什麼不一樣

-i

可使用-i選項在匹配時忽略大小寫,好比說

--color

看看上面的輸出,仍是以爲有點不太爽,輸出都是白色字體,咱們要找的hello到底在一行的什麼位置仍是須要咱們用眼睛費力的去看,其實,grep提供了一個參數徹底能夠解放咱們這種沒必要要的勞力,就是--color 參數,不過須要注意的一點是,這是個長選項參數,Linux命令的參數分爲長選項參數 和短選項參數,長選項參數前是2個-。好了,仍是用上面的文件作個測試看看。

-o

在前面的實例中,包含匹配詞的行整行都會被打印出來,可是有時候咱們並不須要整行打印,只是想看到被匹配的關鍵詞,這時候就須要用到-o 選項了,以下所示。

-A / -B / -C

某些狀況下,咱們不只須要顯示關鍵詞匹配的行,還須要顯示所匹配行的先後行信息,這時候就須要用到-A/-B/-C這三個參數了,

其中:  -A n(n是一個整數)--->表示將匹配行的後n行也顯示

           -B n(n是一個整數)--->表示將匹配行的前n行頁顯示 

           -C n(n是一個整數)--->表示將匹配行的後n行也顯示  

-v

反向查找,也就是說,查找的行是不含所給出的匹配詞的,-v參數就是實現這個功能的,仍是看例子:找出grep.txt文件中不含"hello"的行

在grep.txt文件中找到含有字符串"hello"的全部行

# cat 1.txt | grep "helllo"

-n參數可讓你在顯示所匹配到的內容時同時顯示行號仍是在grep.txt文件中找到含有字符串"hello"的全部行

可使用-i選項在匹配時忽略大小寫,好比說

給匹配到的字符,添加顏色

看看上面的輸出,仍是以爲有點不太爽,輸出都是白色字體,咱們要找的hello到底在一行的什麼位置仍是須要咱們用眼睛費力的去看,其實,grep提供了一個參數徹底能夠解放咱們這種沒必要要的勞力,就是--color 參數,不過須要注意的一點是,這是個長選項參數,Linux命令的參數分爲長選項參數 和短選項參數,長選項參數前是2個-。好了,仍是用上面的文件作個測試看看。

在前面的實例中,包含匹配詞的行整行都會被打印出來,可是有時候咱們並不須要整行打印,只是想看到被匹配的關鍵詞,這時候就須要用到-o 選項了,以下所示。

某些狀況下,咱們不只須要顯示關鍵詞匹配的行,還須要顯示所匹配行的先後行信息,這時候就須要用到-A/-B/-C這三個參數了,

其中:  -A n(n是一個整數)      --->         表示將匹配行的後n行也顯示

           -B n(n是一個整數)      --->          表示將匹配行的前n行頁顯示 

           -C n(n是一個整數)      --->          表示將匹配行的後n行也顯示  

看的有點暈?不要緊,看看下面的例子就明白了。爲了方便閱讀,將測試所需的文件內容在此處再貼出來。

有時候咱們須要反向查找,也就是說,查找的行是不含所給出的匹配詞的,-v參數就是實現這個功能的,仍是看例子:找出grep.txt文件中不含"hello"的行

 

問:grep -A B C通常什麼狀況下會用?

答:shell腳本中會用到。

問:grep 'nologin' passwd  和grep nologin passwd 效果同樣,那何時加 ' ',何時不加.

答:大多時候不加單引號是沒問題的,由於沒有一些特殊的符號,但有特殊符號時,好比你加了一個空格,就得加上單引號。爲了省去這種麻煩,大家沒必要去關心加不加單引號,因此我建議你們所有加上。

 

'string' 單引號 (single quote)
被單引號用括住的內容,將被視爲單一字串。在引號內的表明變數的$符號,沒有做用,也就是說,他被視爲通常符號處理,防止任何變量替換。
heyyou=homeecho '$heyyou' # We get $heyyou


"string" 雙引號 (double quote)
被雙引號用括住的內容,將被視爲單一字串。它防止通配符擴展,但容許變量擴展。這點與單引數的處理方式不一樣。
heyyou=homeecho "$heyyou" # We get home

`command` 倒引號 (backticks)
在前面的單雙引號,括住的是字串,但若是該字串是一列命令列,會怎樣?答案是不會執行。要處理這種狀況,咱們得用倒單引號來作。
fdv=`date +%F`echo "Today $fdv"
在倒引號內的 date +%F 會被視爲指令,執行的結果會帶入 fdv 變數中。


二、 grep中

grep -n 'root' /etc/passwd                                          #在/etc/passwd  目錄中查找root開頭的文件或者目錄

grep -nv 'nologin' /etc/passwd                                  #查找不含有nologin的行

grep '[0-9]'/etc/inittab                                                 #只要文件裏面有0到9的數字(帶數字的),都列出來

grep -v [0-9]'/etc/inittab                                            #不包含數字的行,都列出來

grep -v '^#'/etc/sos.conf                                           #列出來不以#開頭的行

grep -v '^#'/etc/sos.conf|grep -v '^$'                       #不以#開頭的行,去掉

grep '^[^a-zA-Z]' test.txt                                 #不以a-zA-Z開頭的行,顯示出來

grep '^[a-zA-Z]' test.txt                                  #以a-zA-Z開頭的行,顯示出來

grep 'r.o' test.txt                                             #把含有r.o的行顯示出來,.表示任意一個符號,如:roo

grep 'oo*' test.txt                                       #把含有oo*的行顯示出來,*表示任意一個符號,如:oot

grep 'o*o' test.txt                                      #把含有o*o的行顯示出來,*表示任意個o,一個o,或者多個o,或者沒有o,   oo之間能夠沒有字符,如:oo,oto,daemon

grep '.*' test.txt                                #全部的字符內容都會匹配,  .*就是任意一個;例如:grep 'aming.*bash' passwd   :列出來包含aming開頭的,.*bash結尾的行。

grep 'o\{2\}' /etc/passwd=grep -E 'o{2}' /etc/passwd             #o出現兩次或者多個的行顯示出來,如:root,rooot

grep ^111.111.111.111 log_file| awk '{print $1,$7}'         #查看某一個IP訪問了哪些頁面

查看apache當前併發訪問數

對比httpd.conf中MaxClients的數字差距多少

netstat -an | grep ESTABLISHED | wc -l

 

可使用以下參數查看數據

ps -ef|grep httpd|wc -l 1388

統計httpd進程數,連個請求會啓動一個進程,使用於Apache服務器。表示Apache可以處理1388個併發請求,這個值Apache可根據負載狀況自動調整

netstat -nat|grep -i "80"|wc -l 4341

查找較多time_wait鏈接

netstat -n|grep TIME_WAIT|awk '{print $5}'|sort|uniq -c|sort -rn|head -n20

找查較多的SYN鏈接

netstat -an | grep SYN | awk '{print $5}' | awk -F: '{print $1}' | sort | uniq -c | sort -nr | more

查看了鏈接數和當前的鏈接數

netstat -ant | grep $ip:80 | wc -l netstat -ant | grep $ip:80 | grep EST | wc -l

查看IP訪問次數

netstat -nat|grep ":80"|awk '{print $5}' |awk -F: '{print $1}' | sort| uniq -c|sort -n

 

grep -E '(oo){2}' /etc/passwd                           #出現兩次o的行,如:roooot

egrep 'o{2}' /etc/passwd                                  #顯示有兩個或者多個o的行,egrep是grep的擴展。

egrep 'o+' /etc/passwd                                   #顯示一個o或者多個o的行,如:rot,root,rooot

egrep 'oo?' /etc/passwd                                  #?表示重複前面的字符出現一次或者零次

egrep 'root|nologin' /etc/passwd=grep -E 'root|nologin' passwd                  #含有root或者nologin的行,顯示出來。

egrep '(00){2}' /etc/passwd                              #查找/etc/passwd文件中包含兩個o的行。          

.  :     表示任意一個字符

* :   表示零個或者多個字符

{} :     表示一個範圍

.* :     表示統配,全部的匹配,零個或者多個字符.

+ :     1個或者多個字符.

? :       一個或者零個

| :        表示或者

 

例如 [^0-9]  那就是非數字(包括字母+特殊符號)

例如[^a-zA-Z] 那就是非字母(包括數字+特殊符號)

例如[^0-9a-zA-Z]那就是非數字字幕(特殊符號)

[^]  匹配非方括號裏面的內容。就是:只要不是方括號裏面的內容都打印出來。

^[^] 匹配非方括號裏面的內容開頭的全部字符。 只要不是方括號裏面的內容所開頭的,都打印出來。

實例:

拷貝到當前的行

顯示出來不含有#鍵的(不以#開頭的)行

帶顏色的文本搜索,並同時輸出行號

正則表達式模式的搜索

在文件夾下的yml文件中搜索,並標註行號和對應行

grep -nR --color=always a./*.yml

grep -lR a ./*.yml在文件夾下的yml文件中搜索,但只輸出匹配的文件名

 

3 、grep下

grep正則表達式元字符集:
 ^ 錨定行的開始 如:'^grep'匹配全部以grep開頭的行。 


$ 錨定行的結束 如:'grep$'匹配全部以grep結尾的行。 


. 匹配一個非換行符的字符 如:'gr.p'匹配gr後接一個任意字符,而後是p。 


* 匹配零個或多個先前字符 如:'*grep'匹配全部一個或多個空格後緊跟grep的行。 .*一塊兒用表明任意字符。


 [] 匹配一個指定範圍內的字符,如'[Gg]rep'匹配Grep和grep。 


[^] 匹配一個不在指定範圍內的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。 


\(..\) 標記匹配字符,如'\(love\)',love被標記爲1。 


\ 錨定單詞的開始,如:'\匹配包含以grep開頭的單詞的行。 


\> 錨定單詞的結束,如'grep\>'匹配包含以grep結尾的單詞的行。 


x\{m\} 重複字符x,m次,如:'0\{5\}'匹配包含5個o的行。 


x\{m,\} 重複字符x,至少m次,如:'o\{5,\}'匹配至少有5個o的行。 


x\{m,n\}重複字符x,至少m次,很少於n次,如:'o\{5,10\}'匹配5--10個o的行。


 \w 匹配文字和數字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G後跟零個或多個文字或數字字符,而後是p。


 \b 單詞鎖定符,如: '\bgrep\b'只匹配grep。

 

 經常使用的 grep 選項有:
 -c 只輸出匹配行的個數。
 -i 不區分大小寫(只適用於單字符)。
 -h 查詢多文件時不顯示文件名。
 -l 查詢多文件時只輸出包含匹配字符的文件名。
 -n 顯示匹配行及行號。
 -s 不顯示不存在或無匹配文本的錯誤信息。
 -v 顯示不包含匹配文本的全部行。
 -V 顯示軟件版本信息
 使用grep匹配時最好用雙引號引發來,防止被系統誤認爲參數或者特殊命令,也能夠匹配多個單詞。

 關於匹配的實例:
 grep -c "48" test.txt                                統計全部以「48」字符開頭的行有多少
 grep -i "May" test.txt                             不區分大小寫查找「May」全部的行)
 grep -n "48" test.txt                               顯示行號;顯示匹配字符「48」的行及行號,相同於 nl test.txt |grep 48)
 grep -v "48" test.txt                               顯示輸出沒有字符「48」全部的行)
 grep "471" test.txt                                 顯示輸出字符「471」所在的行)
 grep "48;" test.txt                                  顯示輸出以字符「48」開頭,並在字符「48」後是一個tab鍵所在的行
 grep "48[34]" test.txt                            顯示輸出以字符「48」開頭,第三個字符是「3」或是「4」的全部的行)
 grep "^[^48]" test.txt                           顯示輸出行首不是字符「48」的行)
 grep "[Mm]ay" test.txt                          設置大小寫查找:顯示輸出第一個字符以「M」或「m」開頭,以字符「ay」結束的行)
 grep "K…D" test.txt                              顯示輸出第一個字符是「K」,第2、3、四是任意字符,第五個字符是「D」所在的行)
 grep "[A-Z][9]D" test.txt                      顯示輸出第一個字符的範圍是「A-D」,第二個字符是「9」,第三個字符的是「D」的全部的行
 grep "[35]..1998" test.txt                      顯 示第一個字符是3或5,第二三個字符是任意,以1998結尾的全部行
 grep "4\{2,\}" test.txt                          模式出現概率查找:顯示輸出字符「4」至少重複出現兩次的全部行
 grep "9\{3,\}" test.txt                          模式出現概率查找:顯示輸出字符「9」至少重複出現三次的全部行
 grep "9\{2,3\}" test.txt                        模式出現概率查找:顯示輸出字符「9」重複出現的次數在必定範圍內,重複出現2次或3次全部行
 grep -n "^$" test.txt                           顯示輸出空行的行號
 ls -l |grep "^d"                                   若是要查詢目錄列表中的目錄 同:ls -d *
 ls -l |grep "^d[d]"                              在一個目錄中查詢不包含目錄的全部文件
 ls -l |grpe "^d…..x..x"                        查 詢其餘用戶和用戶組成員有可執行權限的目錄集合

 

擴展
把一個目錄下,過濾全部*.php文檔中含有eval的行
grep -r --include="*.php" 'eval' /data/

 

快速找出進程的全部 PID

大多都是使用 PS 、Grep 、AWK 三個命令經過管道符相結合來把對應 PID 找出來 。具體命令相似下樣這樣:

$ ps aux | grep apache | awk '{print $2}'

安裝 PGREP

  • CentOS / RHEL

$ yum  install procps

PGREP 使用

 

PGREP  的使用上很是簡單,下面是一些經常使用的例子。

# 找出 apache2 相關的全部 PID$ pgrep apache2# 找出 root 用戶運行的 sshd 進程 $ pgrep -u root sshd$ renice +4 $(pgrep firefox)

 

 find 搜尋文件或目錄

find /home -name hello*               (查找home目錄下的文件名或目錄爲hello的)

find / -name h?m*                          (在跟目錄下查找h開頭第二個字符是任意的,第三個是m,後面的是任意的字符)

find / -size +1000000k                   (表示在根目錄下查詢文件大於1000000K的文件)

字符串替換命令

:s/well/good/                 替換當前行第一個well 爲 good

:s/well/good/g               替換當前行全部well 爲 good

:n,$s/well/good/            替換第 n 行開始到最後一行中每一行的第一個 well 爲 good

:n,$s/well/good/g         替換第 n 行開始到最後一行中每一行全部 well 爲 good

n 爲數字,若 n 爲 .,表示從當前行開始到最後一行

:%s/well/good/           (等同於 :g/well/s//good/) 替換每一行的第一個 well 爲 good

:%s/well/good/g        ( 等同於 :g/well/s//good/g) 替換每一行中全部 well 爲 good

特殊符號轉義:可使用#做爲分隔符,此時中間出現的 / 不會做爲分隔符

:s#well/#good/#        替換當前行第一個 well/ 爲 good/

:%s#/usr/bin#/bin#g        能夠把文件中全部路徑/usr/bin換成/bin

 重定向命令

ls  -l  /etc/       但願

ls  -l  /etc > /home/myback.txt     (覆蓋重定向)把顯示的結果覆蓋到/home/myback.txt中去

ls  -l  /etc >> /home/myback.txt     (追加劇定向)把顯示的結果追加到/home/myback.txt中去

刪除多行

刪除多行步驟以下:

1. 首先要顯示對應的行數這樣方能知道從第幾行到第幾行刪除

: set nu

2. 按Esc鍵退出,在命令行中輸入:190,6233d(即[190 , 6233]都刪除掉)

若是想要狀況整個文件內容,在直接運行如下命令:

清空文件內容:> log.txt

行位定位

直接定位到最後一行:

按Esc鍵退出,在命令行中輸入: G

直接定位到第一行:

按Esc鍵退出,在命令行中輸入: 1 G

直接定位到某一行:(第17行)

按Esc鍵退出,在命令行中輸入:17 G

 複製一行或多行

<1. 複製一行

yy   複製當前行

p   粘貼

<2. 複製多行

7yy  從當前行開始複製7行

p   粘貼

Linux中查看python的版本

python -V

或者

python --version

ls中文件顏色的顯示錶明的意義爲:

1.藍色--> 目錄

2.綠色--> 可執行文件

3.紅色--> 壓縮文件

4.淺藍色--> 連接文件

5.灰色--> 其餘文件

建立用戶以及查看當前用戶

useradd redis

passwd redis

若是是Ubuntu系統則須要使用以下命令:

useradd openstack -m -s /bin/bash

userdel -r openstack

查看當前系統存在的用戶組和用戶

/etc/group文件包含全部組

/etc/shadow和/etc/passwd系統存在的全部用戶名

經常使用查看文件大小與Linux系統命令

查看內存使用狀況: free -m  (m爲MB,g爲GB)

查看對應磁盤使用狀況: df -lh

查看對應CPU使用狀況: cat /proc/cpuinfo

會有32個大體相同的內容展現(下標是從0開始的),這就說明該服務器爲8核操做系統

cat  /proc/cpuinfo | grep "model name" | head -1(只顯示一行對應的CPU型號以及其餘信息)

cat  /proc/cpuinfo | grep "model name"(系統有幾個核就會顯示幾行)

cat  /proc/cpuinfo | grep "model name" | wc -l(統計出一共有多少核)

查看對應服務器版本當前操做系統發行版信息: cat /etc/issue  或  cat /etc/redhat-release

\{m\}

\{m\} 表示匹配前面字符m次,也就是說前面字符出現m次的行會被匹配,好了,實驗一把吧,查找regular_1.txt 文件中a連續出現2次的行。

只要是連續出現了2次a以上的行都會被匹配上,這個世界究竟怎麼了?我明明只是想要連續出現兩次a的行就能夠了,幹嗎給我返回這麼多。其實很簡單。連續3個a就已經包含了連續2個a,確定能匹配上。再看看第5行,連續4個a包含了2次連續2個a,至關於第5行匹配上了2次。

找出文件中含有連續100個a的行  :cat  regular_1.txt  | grep "a\{100\}"  

\{m,\}

\{m,\} 至少匹配前面字符m次,好了, 咱們再來查找regular_1.txt 文件中a連續 出現2次以上的行。 

仔細看看第四、6行,仍是有些許不一樣的,以第3行爲例,\{2\}形式匹配的時候第3行被匹配上是由於連續包含了2個a被匹配上,所以輸出中最後的a沒有顏色;而\{2,\}形式第3行被匹配上是由於連續包含了3個a才被匹配上。果相同但因卻不同。

\{m,n\} 

\{m,n\} 匹配前面字符 最少m次,最多m次均可以,好了, 咱們再來查找regular_1.txt 文件中a連續 出現2次到3次的行。

第6行含有連續5個a爲何能被匹配上。

 

*

*表示其前面的字符連續出現任意次,這個任意固然包括0次了,也包括屢次,好了,如今咱們用*來匹配測試下。

原始文件中不管有多少個a都被匹配出,儘管第1行不含a字符,但仍是匹配出來了。

\? 

\?表示其前面的字符連續出現0次或者1次,下面咱們用它來匹配regular_1.txt文件中出現0次或者1次的行。

和*匹配的結果是同樣的,儘管結果同樣,可是匹配的原理是不一樣的。以第3行爲例,若是使用*匹配,則第3行是以由於其連續含有2個a被匹配上的;而若是是以\?匹配,則第3行被匹配上是由於先匹配了上1個a,再匹配上後面的a,至關於匹配上了2次。因此有時候看事務是不能只看表面的。

\+

\+ 表示其前面的字符連續出現1次或者屢次,也就是說,\+前面的字符至少要連續出現一次才能匹配上。若是咱們須要查找文件中出現過a字符的行,咱們可使用下面的命令。

 

查看更爲底層的版本信息: cat /proc/version (例如:CentOS實際最根源爲RetHat,此命令將會顯示所採用RetHat的版本)

查看某個文件夾當前所佔用的空間使用:

du -h node            (cd /data/solr-4.8.0/)

查看當前目錄下的全部文件各個大小

du -sh *       (cd /)

查看內存狀況

<1.  jstat -gc pid     能夠看到對應各個內存大小、使用情況以及GC處理狀況

<2.  jmap -heap [pid]     查看內存分佈

<3.  jstat -gcutil [pid] 1000  每隔1s輸出java進程的gc狀況

修改文件夾及其裏面的內容的權限

chown -R solr:solr /home/solr/lib

意思是將 /home/solr/lib 文件夾及其裏面內容的用戶所屬權限修改成solr用戶所屬權限

查看某個端口連接狀態的鏈接數

netstat -nlap | grep -i est | grep -i 6379 | awk '{print $4}'

netstat -nlap | grep -i est | grep -i 1121 | wc -l

netstat常見參數以下:

-a (all)顯示全部選項,默認不顯示LISTEN相關

-t (tcp)僅顯示tcp相關選項

-u (udp)僅顯示udp相關選項

-n 拒絕顯示別名,能顯示數字的所有轉化成數字。

-l 僅列出有在 Listen (監聽) 的服務狀態

-p 顯示創建相關連接的程序名

-r 顯示路由信息,路由表

-e 顯示擴展信息,例如uid等

-s 按各個協議進行統計

-c 每隔一個固定時間,執行該netstat命令。

提示:LISTEN和LISTENING的狀態只有用-a或者-l才能看到

 同步服務器的時間

ntpdate pool.ntp.org

將這個命令啓用爲定時腳本執行,具體以下所示:

1 */2 * * * ntpdate pool.ntp.org

不容許ssh登陸如何配置

修改vim /etc/sysconfig/sshd_config文件,增長一行:AllowUsers solr,具體以下所示:

使其生效運行以下命令:

service sshd reload

經常使用系統級配置總結:

1. 限制登陸:/etc/ssh/sshd_config    修改後需重啓:service sshd restart

2. 用戶配置:/etc/passwd

3. sudo權限:/etc/sudoers

經常使用JDK系統環境變量配置

1.JAVA_HOME=/usr/java/jdk1.7.0_55

2.CLASSPATH=.:$JAVA_HOME/lib.tools.jar

3.PATH=$JAVA_HOME/bin:$PATH

4.exportJAVA_HOME CLASSPATH PATH

.看Redis/Tomcat的版本

redis-cli  info  |  grep  'redis_version'

tomcat版本須要進入到安裝目錄下的 bin/ 文件夾:

./version.sh  或者  sh version.sh

查看linux的防火牆是否阻止80端口

1iptables -vnL |grep":80 "

 

 

參考連接 :

【Linux命令】 grep命令基本用法: https://mp.weixin.qq.com/s/yOfak3KrezgCw0sXreGZ8w

別不信!掌握好這23個Linux命令經常使用項,可加薪30% : https://mp.weixin.qq.com/s/e5rKYqxv_XwKceD17Sy6nQ

 

 

 

連接  :

linux下使用grep恢復被刪文件內容   :  http://blog.chinaunix.net/uid-25266990-id-2744805.html

grep&正則表達式  :  https://www.cnblogs.com/keerya/p/7307026.html

grep&fgrep&egrep&wc&diff&patch&wc&cut&sort&uniq :  grep&fgrep&egrep&wc&diff&patch&wc&cut&sort&uniq

grep零寬斷言&正則表達式  :  http://blog.51cto.com/hmtk520/2074219

 

腳本之家 : 

正則表達式速查表 :  https://www.jb51.net/tools/regexsc.htm

正則表達式30分鐘入門教程 : https://www.jb51.net/tools/zhengze.html

文本處理之正則表達式和grep     :    http://blog.51cto.com/11551196/1834866

相關文章
相關標籤/搜索