Linux之grep及正則表達式

grep簡介

  grep 是一種強大的文本搜索工具,它能使用正則表達式搜索文本,並把匹配的行打印出來。一般grep有三種版本grep、egrep(等同於grep -E)和fgrep。egrep爲擴展的grep,fgrep則爲快速grep(固定的字符串來對文本進行搜索,不支持正則表達式的引用可是查詢極爲快速)。grep是Linux文本處理三劍客之一。git

grep使用方式

  使用方式:grep [OPTIONS] PATTERN [FILE...]正則表達式

  grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]shell

  經常使用選項:

  --color=auto:對匹配到的文本着色後進行高亮顯示;app

   -i:忽略字符的大小寫工具

  -o:僅顯示匹配到的字符串學習

  -v:顯示不能被模式匹配到的行ui

  -E:支持使用擴展的正則表達式spa

  -q:靜默模式,即不輸出任何信息code

  -A #:顯示被模式匹配的行及其後#行blog

  -B #:顯示被模式匹配的行及其前#行

  -C #:顯示被模式匹配的行及其先後各#行

   :使用grep匹配時需使用雙引號引發來(單引號爲強引用),防止被系統誤認爲參數或者特殊命令而報錯。

擴展grep使用方式

  使用方式:egrep [OPTIONS] PATTERN [FILE...] 

  grep -E [OPTIONS] PATTERN [FILE...]

  -i:忽略字符的大小寫
  -o:僅顯示匹配到的字符串自己
  -v:顯示不被模式匹配到的行
  -q:靜默模式,即不輸出任何信息
  -A #:顯示被模式匹配的行及其後#行
  -B #:顯示被模式匹配的行及其前#行
  -C #:顯示被模式匹配的行及其先後各#行
  -G:支持基本正則表達式

grep正則表達式元字符

  ‘^‘: 錨定行首

  ‘$’: 錨定行尾 

  ‘.‘: 匹配任一一個字符

  ‘*’: 匹配零個或多個先前字符 

  ‘\?‘:匹配其前面的字符0次或者1次;

  ‘\+’:匹配其前面的字符1次或者屢次;

  ‘\{m\}‘:匹配其前面的字符m次(\爲轉義字符)

  ‘\{m,n\}’:匹配其前面的字符至少m次,至多n次

  ‘[]‘: 匹配一個指定範圍內的字符 | ‘[^]’匹配指定範圍外的任意單個字符

  ‘\<‘或‘\b’:錨定詞首,‘\>’或‘\b’:錨定詞尾(可用\<PATTERN\>:匹配完整單詞)

  ‘\(\)’:將多個字符當作一個總體進行處理

  後向引用:引用前面的分組括號中的模式所匹配到的字符

  分組括號中的模式匹配到的內容或被正則表達式引擎自動記錄於內部的變量中:

  \1:模式從左側起,第一個左括號及與之匹配的右括號之間模式匹配到的內容

  \2:模式從左側起,第二個左括號及與之匹配的右括號之間模式匹配到的內容...

  擴展正則表達式與正則表達式略有不一樣:

  '[]':依舊匹配指定範圍內的任意單個字符;可是有不少特殊匹配方式。

    [:digit:] 匹配任意單個數字

    [:lower:] 匹配任意單個小寫字母               

    [:upper:] 匹配任意單個大寫字母

    [:alpha:] 匹配任意單個字母

    [:alnum:] 匹配任意單個字母或數字

    [:punct:] 匹配任意單個符號

    [:space:] 匹配單個空格

  一些地方取消了轉義字符的使用:

  ‘?‘:匹配其前面的字符0次或者1次;

  ‘+’:匹配其前面的字符1次或者屢次;

  ‘{m}‘:匹配其前面的字符m次(\爲轉義字符)

  ‘{m,n}’:匹配其前面的字符至少m次,至多n次

  ():將一個或多個字符捆綁在一塊兒,當作一個總體進行處理,反向引用照常使用。

  ‘|’:或(:‘C|cat’爲C與cat,‘(C|c)at纔是Cat與cat’)

練習題:

  一、列出當前系統上全部已經登陸的用戶的用戶名,注意:同一個用戶登陸屢次,則只顯示一次

[root@localhost ~]# who | cut -d' ' -f1|uniq
root

  二、取出最後登陸到當前系統的用戶的相關信息

[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`
uid=0(root) gid=0(root) groups=0(root)

  3.取出當前系統上被用戶當作其默認shell最多的那個shell

[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7
/sbin/nologin

  4.將/etc/passd中的第三個字段設置最大的後10個用戶的信息所有改成大寫保存至/tmp/maxuser.txt文件中

[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt
[root@localhost ~]# cat /tmp/maxusers.txt 
NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGIN
SYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGIN
NGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGIN
CHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGIN
POLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGIN
SYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGIN
DINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASH
JEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASH
EGON:X:1002:1002::/HOME/EGON:/BIN/BASH
NFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN

  5.取出當前主機的IP地址

[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10
192.168.0.133

  6.列出/etc目錄下全部已.conf結尾的文件的文件名,並將其名字轉換爲大寫後保存至/tmp/etc.conf文件中

[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf
[root@localhost ~]# cat /tmp/etc.conf 
RESOLV.CONF
CA-LEGACY.CONF
FASTESTMIRROR.CONF
LANGPACKS.CONF
SYSTEMD.CONF
VERSION-GROUPS.CONF
LVM.CONF
LVMLOCAL.CONF
ASOUND.CONF
LDAP.CONF
MLX4.CONF
RDMA.CONF
SMTPD.CONF

  7.顯示/var目錄下一級子目錄或文件的總數

[root@localhost ~]# ls /var | wc -l
21

  8.取出/etc/group第三個字段數值最小的10個組的名字

[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1
root
bin
daemon
sys
adm
tty
disk
lp
mem
kmem

  9.將/etc/fstab和/etc/issue文件的內容合併爲同一個內容後保存至/tmp/etc.test文件中

[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test
[root@localhost ~]# cat /tmp/etc.test 

#
# /etc/fstab
# Created by anaconda on Sat May 13 10:12:58 2017
#
# Accessible filesystems, by reference, are maintained under '/dev/disk'
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
/dev/mapper/cl-root     /                       xfs     defaults        0 0
UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot                   xfs     defaults        0 0
/dev/mapper/cl-swap     swap                    swap    defaults        0 0
\S
Kernel \r on an \m

  對於正則表達式的使用須要多聯繫增強記憶,不然是用很差正則表達式的,在學習過程當中切記多寫多背。

相關文章
相關標籤/搜索