grep (縮寫來自Globally search a Regular Expression and Print)是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹配的行打印出來。Unix的grep家族包括grep、egrep和fgrephtml
表達符集java
列出個別使用頻發的選項正則表達式
一、-v 顯示不包含匹配文本的全部行json
過濾掉文件中aaa的行數工具
二、-l 輸出匹配的文件名spa
-l 查詢多文件時只輸出包含匹配字符的文件名,而不輸出文本行。htm
$grep -l "lcj" * datafile
三、-i 忽略大小寫blog
-i 關閉大小寫敏感性。get
示例,查找含有「lcj」這三個字符的行,而且不區分大小寫: io
[root@lcj lcj]# cat aa.txt aaaa BBBB cccc DDDD eeee EEEE [root@lcj lcj]# grep bb aa.txt [root@lcj lcj]# grep -i bb aa.txt BBBB [root@lcj lcj]#
四、-n 顯示匹配的行及行號
示例:查找aa.txt文件中含有「CAD」的全部行,並顯示行號:
[root@lcj lcj]# grep -n c aa.txt 3:cccc [root@lcj lcj]#
須要截取GET後面的html數據,前提是要過濾出http 狀態碼爲200
grep 「\」 200 :過濾出http狀態碼爲200
awk -F 「GET」:指定從那列開始截取
‘{print $2}’:去除字段之間的空格進行截取【如: _"GET_ /11260464.html 】
上面截圖雖然前面的字段是咱們所須要的字段,可後面還有多餘的數據,以下過濾後面多餘的數據:
awk '{print $1}':去除第一個空格以後的全部數據
head:顯示前面10條數據,方便查看數據截取結果,最後能夠經過>進行重定向指定文件中
案例
增長「grep」和「awk「命令結合使用案列:
案例:須要獲取GET請求 ,狀態碼爲200,並過濾掉json和area字段的全部行
[root@lcj lcj]# cat 200.txt |grep " 200 " | awk -F"GET" '{print $2}'| awk '{print $1}' | grep -v "/js/" |grep -v area >test001.csv
grep -v過濾字段所在行