文本三劍客之sed

sed是一種流編輯器,它是文本處理中很是好的工具,可以完美的配合正則表達式使用,功能與衆不同。處理時,把當前處理的行存儲在臨時緩衝區中,稱爲「模式空間」(pattern space),接着用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往屏幕。接着處理下一行,這樣不斷重複,直到文件末尾。文件內容並無改變,除非你使用重定向存儲輸出。Sed主要用來自動編輯一個或多個文件,能夠將數據行進行替換、刪除、新增、選取等特定工做,簡化對文件的反覆操做,編寫轉換程序等。git

命令格式:
sed的命令格式:sed [options] 'command' file(s);
sed的腳本格式:sed [options] -f scriptfile file(s);
選項:
-e :直接在命令行模式上進行sed動做編輯,此爲默認選項;
-f :將sed的動做寫在一個文件內,用–f filename 執行filename內的sed動做;
-i :直接修改文件內容;
-n :只打印模式匹配的行;
-r :支持擴展表達式;
-h或--help:顯示幫助;
-V或--version:顯示版本信息。
經常使用命令:
a\ 在當前行下面插入文本;
i\ 在當前行上面插入文本;
c\ 把選定的行改成新的文本;
d 刪除,刪除選擇的行;
D 刪除模板塊的第一行;
s 替換指定字符;
h 拷貝模板塊的內容到內存中的緩衝區;
H 追加模板塊的內容到內存中的緩衝區;
g 得到內存緩衝區的內容,並替代當前模板塊中的文本;
G 得到內存緩衝區的內容,並追加到當前模板塊文本的後面;
l 列表不能打印字符的清單;
n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令;
N 追加下一個輸入行到模板塊後面並在兩者間嵌入一個新行,改變當前行號碼;
p 打印模板塊的行。 P(大寫) 打印模板塊的第一行;
q 退出Sed;
b lable 分支到腳本中帶有標記的地方,若是分支不存在則分支到腳本的末尾;
r file 從file中讀行;
t label if分支,從最後一行開始,條件一旦知足或者T,t命令,將致使分支到帶有標號的命令處,或者到腳本的末尾;
T label 錯誤分支,從最後一行開始,一旦發生錯誤或者T,t命令,將致使分支到帶有標號的命令處,或者到腳本的末尾;
w file 寫並追加模板塊到file末尾;
W file 寫並追加模板塊的第一行到file末尾;
! 表示後面的命令對全部沒有被選定的行發生做用;
= 打印當前行號;正則表達式

把註釋擴展到下一個換行符之前;

替換標記:
g 表示行內全面替換;
p 表示打印行;
w 表示把行寫入一個文件;
x 表示互換模板塊中的文本和緩衝區中的文本;
y 表示把一個字符翻譯爲另外的字符(可是不用於正則表達式);
\1 子串匹配標記;
& 已匹配字符串標記;express

元字符集:
^ 匹配行開始,如:/^sed/匹配全部以sed開頭的行;
$ 匹配行結束,如:/sed$/匹配全部以sed結尾的行;
. 匹配一個非換行符的任意字符,如:/s.d/匹配s後接一個任意字符,最後是d;centos

  • 匹配0個或多個字符,如:/*sed/匹配全部模板是一個或多個空格後緊跟sed的行;
    [] 匹配一個指定範圍內的字符,如/[ss]ed/匹配sed和Sed;
    [^] 匹配一個不在指定範圍內的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一個字母開頭,緊跟ed的行;
    (..) 匹配子串,保存匹配的字符,如s/(love)able/\1rs,loveable被替換成lovers;
    & 保存搜索字符用來替換其餘字符,如s/love/&/,love這成love;
    \< 匹配單詞的開始,如:/\
    \> 匹配單詞的結束,如/love\>/匹配包含以love結尾的單詞的行;
    x{m} 重複字符x,m次,如:/0{5}/匹配包含5個0的行;
    x{m,} 重複字符x,至少m次,如:/0{5,}/匹配至少有5個0的行;
    x{m,n} 重複字符x,至少m次,很少於n次,如:/0{5,10}/匹配5~10個0的行;

實例:
替換操做:S命令
sed 's/book/books/' file 替換文本中的字符串
sed -n 's/test/TEST/p' file -n選項和p命令一塊兒使用表示只打印那些發生替換的行
sed -i 's/book/books/g' file 直接編輯文件選項-i,會匹配file文件中每一行的第一個book替換爲books
sed 's/book/books/g' file 使用後綴 /g 標記會替換每一行中的全部匹配
當須要從第N處匹配開始替換時,可使用 /Ng
echo sksksksksksk | sed 's/sk/SK/2g'
skSKSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/3g'
skskSKSKSKSK
echo sksksksksksk | sed 's/sk/SK/4g'
skskskSKSKSK
以上命令中字符 / 在sed中做爲定界符使用,也可使用任意的定界符
sed 's:test:TEXT:g'
sed 's|test|TEXT|g'
sed 's#test#TEXT#g'
sed 's/\/bin/\/usr\/local\/bin/g' 定界符出如今樣式內部時,須要進行轉義
刪除操做:d命令
sed '/^$/d' file 刪除空白行
sed '2d' file 刪除文件的第2行
sed '2,$d' file 刪除文件的第2行到末尾全部行
sed '$d' file 刪除文件最後一行
sed '/^test/'d file 刪除文件中全部開頭是test的行
已匹配字符串標記&
echo this is a test line | sed 's/\w+/[&]/g'
[this] [is] [a] [test] [line] 正則表達式 \w+ 匹配每個單詞,使用 [&] 替換它,& 對應於以前所匹配到的單詞
sed 's/^192.168.0.1/&localhost/' file 192.168.0.1localhost 全部以192.168.0.1開頭的行都會被替換成它自已加localhost緩存

子串匹配標記\1
echo this is digit 7 in a number | sed 's/digit ([0-9])/\1/'
this is 7 in a number 匹配給定樣式的其中一部分
命令中 digit 7,被替換成了 7。樣式匹配到的子串是 7,(..) 用於匹配子串,對於匹配到的第一個子串就標記爲 \1,依此類推匹配到的第二個結果就是 \2,例如:
echo aaa BBB | sed 's/([a-z]+) ([A-Z]+)/\2 \1/'
BBB aaa
sed -n 's/(love)able/\1rs/p' file love被標記爲1,全部loveable會被替換成lovers,並打印出來:
組合多個表達式
sed '表達式' | sed '表達式' 等價於:
sed '表達式; 表達式'編輯器

引用
sed表達式可使用單引號來引用,可是若是表達式內部包含變量字符串,就須要使用雙引號
test=hello
echo hello WORLD | sed "s/$test/HELLO"
HELLO WORLD
選定行的範圍:,(逗號)
全部在模板test和check所肯定的範圍內的行都被打印:
sed -n '/test/,/check/p' file
打印從第5行開始到第一個包含以test開始的行之間的全部行:
sed -n '5,/^test/p' file
對於模板test和west之間的行,每行的末尾用字符串aaa bbb替換:
sed '/test/,/west/s/$/aaa bbb/' file
多點編輯:e命令
-e選項容許在同一行裏執行多條命令
sed -e '1,5d' -e 's/test/check/' file
上面sed表達式的第一條命令刪除1至5行,第二條命令用check替換test。命令的執行順序對結果有影響。若是兩個命令都是替換命令,那麼第一個替換命令將影響第二個替換命令的結果。ide

和 -e 等價的命令是 --expression
sed --expression='s/test/check/' --expression='/love/d' file
從文件讀入:r命令
file裏的內容被讀進來,顯示在與test匹配的行後面,若是匹配多行,則file的內容將顯示在全部匹配行的下面
sed '/test/r file' filename
寫入文件:w命令
在example中全部包含test的行都被寫入file裏
sed -n '/test/w file' example
追加(行下):a\命令
將 this is a test line 追加到 以test 開頭的行後面
sed '/^test/a\this is a test line' file
在 test.conf 文件第2行以後插入 this is a test line
sed -i '2a\this is a test line' test.conf
插入(行上)工具

i\命令 將 this is a test line 追加到以test開頭的行前面
sed '/^test/i\this is a test line' file
在test.conf文件第5行以前插入this is a test linethis

sed -i '5i\this is a test line' test.conf
下一個:n命令
若是test被匹配,則移動到匹配行的下一行,替換這一行的aa,變爲bb,並打印該行,而後繼續
sed '/test/{ n; s/aa/bb/; }' file
變形:y命令
把1~10行內全部abcde轉變爲大寫,注意,正則表達式元字符不能使用這個命令
sed '1,10y/abcde/ABCDE/' file
退出:q命令
打印完第10行後,退出sed sed '10q' file 保持和獲取:h命令和G命令 在sed處理文件的時候,每一行都被保存在一個叫模式空間的臨時緩衝區中,除非行被刪除或者輸出被取消,不然全部被處理的行都將打印在屏幕上。接着模式空間被清空,並存入新的一行等待處理。
sed -e '/test/h' -e '$G' file
在這個例子裏,匹配test的行被找到後,將存入模式空間,h命令將其複製並存入一個稱爲保持緩存區的特殊緩衝區內。第二條語句的意思是,當到達最後一行後,G命令取出保持緩衝區的行,而後把它放回模式空間中,且追加到如今已經存在於模式空間中的行的末尾。在這個例子中就是追加到最後一行。簡單來講,任何包含test的行都被複制並追加到該文件的末尾centos7

保持和互換:h命令和x命令
互換模式空間和保持緩衝區的內容。也就是把包含test與check的行互換
sed -e '/test/h' -e '/check/x' file
腳本scriptfile
sed腳本是一個sed的命令清單,啓動Sed時以-f選項引導腳本文件名。Sed對於腳本中輸入的命令很是挑剔,在命令的末尾不能有任何空白或文本,若是在一行中有多個命令,要用分號分隔。以#開頭的行爲註釋行,且不能跨行。
sed [options] -f scriptfile file(s)
打印奇數行或偶數行
方法1:
sed -n 'p;n' test.txt #奇數行

sed -n 'n;p' test.txt #偶數行
方法2:
sed -n '1~2p' test.txt #奇數行

sed -n '2~2p' test.txt #偶數行
打印匹配字符串的下一行
grep -A 1 Is test.txt // grep方法

sed -n '/I/{n;p}' test.txt // sed方法

awk '/Is/{getline; print}' test.txt // awk方法

綜合練習
copy一份/etc/passwd文件練習
[root@centos7-1 ~]# cp /etc/passwd ./

[root@centos7-1 ~]# sed -n 's/^root/#&/p' passwd // 註釋掉以root開頭的行
[root@centos7-1 ~]# sed -n -r 's/^root|^ntp/#&/p' passwd // 註釋掉以root開頭或者以ntp開頭的行
[root@centos7-1 ~]# sed -n '1,5s/^[a-z].*/#&/p' passwd // 註釋掉1~5行中以任意小寫字母開頭的行
[root@centos7-1 ~]# sed -n '1,5s/^/#/p' passwd // 註釋1~5行
[root@centos7-1 ~]# sed -n 's/^/#/p' passwd // 快速註釋一個文件
[root@centos7-1 ~]# sed -n 's/^#//p' passwd // 快速取消註釋

[root@centos7-1 ~]# sed -n '1,5s/[0-9:/]//gp' passwd // 去掉文件1-5行中的數字、冒號、斜槓
或者:
[root@centos7-1 ~]# sed -n '1,5s/[^a-Z]//gp' passwd

[root@centos7-1 ~]# sed -n 's/[0-9]/#/pg' passwd // 打印匹配將任意數字替換#
[root@centos7-1 ~]# sed -n 's/[0-9]/\t/pg' passwd // 打印匹配將任意數字替換成製表符

刪除vsftpd.conf配置文件裏面全部註釋的行及空行

[root@centos7-1 ~]# sed -e '/^#/d' -e '/^$/d' /etc/vsftpd/vsftpd.conf
或者:
[root@centos7-1 ~]# sed -r '/^#|^$/d' /etc/vsftpd/vsftpd.conf
或者:
[root@centos7-1 ~]# sed '/^#/d;/^$/d' /etc/vsftpd/vsftpd.conf

使用sed命令截取ip地址

centos7系統
[root@centos7-1 ~]# ifconfig eth0 |sed -n 's#.inet (.)netmask.#\1#p' // 方法一
[root@centos7-1 ~]# ifconfig eth0 |sed -n '2p' |sed -n 's/.
inet (.)netmask./\1/p' // 方法二

centos6系統
[root@centos6-1 ~]# ifconfig em1 |sed -n 's#.addr:(.)Bcast.#\1#p' // 方法一
[root@centos6-1 ~]# ifconfig em1 |sed -n '2p' |sed -n 's/.
addr:(.)Bcast./\1/p' // 方法二

使用sed命令一次性截取ip地址、廣播地址、子網掩碼

[root@centos7-1 ~]# ifconfig eth0 |sed -n 's#.inet (.)netmask (.)broadcast (.)#\1\n\2\n\3#p'
[root@centos7-1 ~]# ifconfig eth0 |sed -n 's#.inet (.)netmask (.)broadcast (.)#IP地址:\1\n廣播地址:\2\n子網掩碼:\3#p'
[root@centos6-1 ~]# ifconfig em1 |sed -n 's#.addr:(.)Bcast:(.)Mask:(.)#\1\n\2\n\3#p'

相關文章
相關標籤/搜索