第十一課（上）：正則表達式

時間 2019-12-04

原文原文鏈接

一、正則表達式是什麼

主要用於字符串的模式分割、匹配、查找及替換操做。正則表達式

通配符

通配符	做用
*	匹配任意內容
？	匹配任意一個內容
[]	匹配中括號的一個字符

通配符 *code

[root@localhost ~]# ls *.txt
1.txt  2.txt  a.txt

通配符？字符串

[root@localhost ~]# ls 1?3
123

通配符 [ ]table

[root@localhost ~]# ls [0-9].txt
1.txt  2.txt

正則表達式和通配符的區別

正則表達式用來在文件中匹配符合條件的字符串，正則是包含匹配。

通配符用來匹配符合條件的文件名，通配符是徹底匹配。

基礎正則表達式

字符	做用
*	前一個字符匹配0次或任意屢次
.	匹配除了換行符外任意一個字符
^	匹配行首
&	匹配行尾
[]	匹配中括號中指定的任意一個字符，只匹配一個字符
\	轉義符
\ {n\ }	表示其前面的字符剛好出現n次
\ {n,m\ }	匹配其前面的字符至少出現n次，最多出現m次

# * 前一個字符匹配0次，或任意屢次

「a*」

匹配全部內容，包括空白行。test

[root@localhost ~]# grep "a*" test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb

b
bb
bbb
bbbb
bbbbb

「aa*」匹配至少包含有一個a的行。

[root@localhost ~]# grep "aa*" test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb

「aaa*」匹配最少包含兩個連續a的字符串。

[root@localhost ~]# grep "aaa*" test.txt 
aa
aaa
aaaa
aaaaa
aabb

「aaaa*」

匹配最少包含四個連續a的字符串。基礎

[root@localhost ~]# grep "aaaaa*" test.txt 
aaaa
aaaaa

# . 匹配除了換行符外任意一個字符

「r..t」匹配兩個字母之間有兩個字母的單詞

[root@localhost ~]# cat test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb
root
raat
rabcdet
b
bb
bbb
bbbb
bbbbb
[root@localhost ~]# grep "r..t" test.txt 
root
raat

"r.*t"匹配在r和t之間的任意字符

[root@localhost ~]# grep "r.*t" test.txt 
root
raat
rabcdet

".*" 匹配全部內容

[root@localhost ~]# grep ".*" test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb
root
raat
rabcdet
b
bb
bbb
bbbb
bbbbb

# 「^」匹配行首 "$"匹配行尾

「^r」匹配以r開頭的行

[root@localhost ~]# grep "^r" test.txt 
root
raat
rabcdet

"t$" 匹配以t結尾的行

[root@localhost ~]# grep "t$" test.txt 
root
raat
rabcdet

"^$"匹配全部空白行

[root@localhost ~]# grep -n "^$" test.txt 
11:
13:

使用這個命令會打印出空格行grep

# [] 匹配中括號中指定的任意一個字符，只匹配一個字符

"r[ao]ot" 匹配r和t 字母中，包括a和o的字符

[root@localhost ~]# cat test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb
root
raat
rabcdet

b
aaa123
123
456
789
1234567890
aaa123bbb
123bbb

bb
bbb
bbbb
bbbbb
[root@localhost ~]# grep "r[ao]at" test.txt 
raat

"[0-9]" 匹配任意一個數字

[root@localhost ~]# grep -n "[0-9]" test.txt 
13:aaa123
14:123
15:456
16:789
17:1234567890
18:aaa123bbb
19:123bbb

" ^ [ a-z ] " 匹配用小寫字母開頭的行

[root@localhost ~]# grep -n "^[a-z]" test.txt 
1:a
2:aa
3:aaa
4:aaaa
5:aaaaa
6:ab
7:aabb
8:root
9:raat
10:rabcdet
12:b
13:aaa123
18:aaa123bbb
21:bb
22:bbb
23:bbbb
24:bbbbb

"^"在中括號外表示行首，在中括號以內表示取反

[root@localhost ~]# grep -n "^[^a-z]" test.txt 
14:123
15:456
16:789
17:1234567890
19:123bbb

# " \ " 轉義符

能夠將特殊符號的做用取消，再也不具備特殊做用tab

[root@localhost ~]# grep ".$" test.txt 
a
aa
aaa
aaaa
aaaaa
ab
aabb
root.
raat.
rabcdet
b
aaa123
123
456
789
1234567890
aaa123bbb
123bbb
bb
bbb
bbbb
bbbbb

此種操做是錯誤的，由於「.」這裏具備特殊的含義，表示以任意字符結尾的列出。在這裏須要加上轉義符。列出以「.」結尾的行文件

[root@localhost ~]# grep -n "\.$" test.txt 
8:root.
9:raat.

# \ {n\ } 表示其前面的字符剛好出現n次

「a\ {3\ }」匹配字謎a連續出現三次的字符串

# \ {n,m\ }| 匹配其前面的字符至少出現n次，最多出現m次

# 提取日期格式

[root@localhost ~]# cat test.txt 
2018-06-05
20180605
180605

[root@localhost ~]# grep "[0-9]\{4\}-[0-9]\{2\}-[0-9]\{2\}" test.txt 
2018-06-05

# 提取手機號碼

[root@localhost ~]# grep "[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}[0-9]\{1\}" test.txt 
13911111111

# 提取IP地址

[root@localhost ~]# grep "[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}" test.txt 
192.168.1.1

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。