文本處理工具之二 sed命令詳解html
sed:Stream Editor文本流編輯,sed是一個「非交互式的」面向字符流的編輯器。能同時處理多個文件多行的內容,能夠不對原文件改動,把整個文件輸入到屏幕,能夠把只匹配到模式的內容輸入到屏幕上。還能夠對原文件改動,可是不會再屏幕上返回結果。git
sed命令的語法格式:正則表達式
sed的命令格式: sed [option] 'sed command'filenameshell
sed的腳本格式:sed [option] -f 'sed script'filenameexpress
sed命令的選項(option):bash
-n :只打印模式匹配的行編輯器
-e :直接在命令行模式上進行sed動做編輯,此爲默認選項ide
-f :將sed的動做寫在一個文件內,用–f filename 執行filename內的sed動做工具
-r :支持擴展表達式post
-i :直接修改文件內容
sed在文件中查詢文本的方式:
1)使用行號,能夠是一個簡單數字,或是一個行號範圍
x |
x爲行號 |
x,y |
表示行號從x到y |
/pattern |
查詢包含模式的行 |
/pattern /pattern |
查詢包含兩個模式的行 |
pattern/,x |
在給定行號上查詢包含模式的行 |
x,/pattern/ |
經過行號和模式查詢匹配的行 |
x,y! |
查詢不包含指定行號x和y的行 |
2)使用正則表達式、擴展正則表達式(必須結合-r選項)
^ |
錨點行首的符合條件的內容,用法格式"^pattern" |
$ |
錨點行首的符合條件的內容,用法格式"pattern$" |
^$ |
空白行 |
. |
匹配任意單個字符 |
* |
匹配緊挨在前面的字符任意次(0,1,屢次) |
.* |
匹配任意長度的任意字符 |
\? |
匹配緊挨在前面的字符0次或1次 |
\{m,n\} |
匹配其前面的字符至少m次,至多n次 |
\{m,\} |
匹配其前面的字符至少m次 |
\{m\} |
精確匹配前面的m次\{0,n\}:0到n次 |
\< |
錨點詞首----至關於 \b,用法格式:\<pattern |
\> |
錨點詞尾,用法格式:\>pattern |
\<pattern\> |
單詞錨點 |
\(\) |
分組,用法格式:\(pattern\),引用\1,\2 |
[] |
匹配指定範圍內的任意單個字符 |
[^] |
匹配指定範圍外的任意單個字符 |
[:digit:] |
全部數字, 至關於0-9, [0-9]---> [[:digit:]] |
[:lower:] |
全部的小寫字母 |
[:upper:] |
全部的大寫字母 |
[:alpha:] |
全部的字母 |
[:alnum:] |
至關於0-9a-zA-Z |
[:space:] |
空白字符 |
[:punct:] |
全部標點符號 |
#######sed的匹配模式支持正則表達式##################### sed'5 q'/etc/passwd#打印前5行 sed-n '/r*t/p'/etc/passwd#打印匹配r有0個或者多個,後接一個t字符的行 sed-n '/.r.*/p'/etc/passwd#打印匹配有r的行而且r後面跟任意字符 sed-n '/o*/p'/etc/passwd#打印o字符重複任意次 sed-n '/o\{1,\}/p'/etc/passwd#打印o字重複出現一次以上 sed-n '/o\{1,3\}/p'/etc/passwd#打印o字重複出現一次到三次之間以上
sed的編輯命令(sed command):
p |
打印匹配行(和-n選項一塊兒合用) |
= |
顯示文件行號 |
a\ |
在定位行號後附加新文本信息 |
i\ |
在定位行號後插入新文本信息 |
d |
刪除定位行 |
c\ |
用新文本替換定位文本 |
w filename |
寫文本到一個文件,相似輸出重定向 > |
r filename |
從另外一個文件中讀文本,相似輸入重定向 < |
s |
使用替換模式替換相應模式 |
q |
第一個模式匹配完成後退出或當即退出 |
l |
顯示與八進制ACSII代碼等價的控制符 |
{} |
在定位行執行的命令組,用分號隔開 |
n |
從另外一個文件中讀文本下一行,並從下一條命令而不是第一條命令開始對其的處理 |
N |
在數據流中添加下一行以建立用於處理的多行組 |
g |
將模式2粘貼到/pattern n/ |
y |
傳送字符,替換單個字符 |
對文件的操做無非就是」增刪改查「,怎樣用sed命令實現對文件的」增刪改查「,玩轉sed是寫自動化腳本必須的基礎之一。
sed命令打印文件信息(查詢):
####用sed打印文件的信息的例子的命令###### sed -n '/^#/!p' /etc/vsftpd/vsftpd.conf sed -n '/^#/!{/^$/!p}' /etc/vsftpd/vsftpd.conf sed -e '/^#/d' -e '/^$/d' /etc/vsftpd/vsftpd.conf sed -n '1,/adm/p' /etc/passwd sed -n '/adm/,6p' /etc/passwd sed -n '/adm/,4p' /etc/passwd sed -n '/adm/,2p' /etc/passwd ###如下圖片是對這些sed命令例子的解釋和顯示結果
sed命令實現對文件內容的添加:(對源文件添加的話就用-i參數):
####sed命令能夠實現的添加###### #1)匹配行的行首添加,添加在同行 #2)匹配行的行中的某個字符後添加 #3)匹配行的行尾添加字符 #4)匹配行的行前面行添加 #5)匹配行的行後面行添加 #6)文件的行首添加一行 [root@jie1 ~]# sed -i '1 i\sed command start' myfile #7)文件的行尾追加一行 [root@jie1 ~]# sed -i '$a \sed command end' myfile
sed命令實現對文件內容的刪除:(對源文件直接刪除用-i參數):
sed的刪除操做是針對文件的行,若是想刪除行中的某個字符,那就用替換(別急,替換稍後就講,並且替換是sed最經常使用的)
重點:sed命令實現對文件內容的替換(替換是在shell自動化腳本中用到最多的操做)
#================源文件裏面的內容=============================== [root@jie1 ~]# cat test anonymous_enable=YES write_enable=YES local_umask=022 xferlog_enable=YES connect_from_port_20=YES root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin DEVICE="eth0" BOOTPROTO="static" HWADDR="00:0C:29:90:79:78" ONBOOT="yes" IPADDR=172.16.22.1 NETMASK=255.255.0.0 #====================================================================== [root@jie1 ~]# sed -i '/DEVICE/c\Ethernet' test #匹配DEVICE的行,替換成Ethernet這行 [root@jie1 ~]# sed -i 's/static/dhcp/' test #把static替換成dhcp(/,@,#都是前面所說的地址定界符) [root@jie1 ~]# sed -i '/IPADDR/s@22\.1@10.12@' test #匹配IPADDR的行,把22.1替換成10.12因爲.號有特殊意義全部須要轉義 [root@jie1 ~]# sed -i '/connect/s#YES#NO#' test #匹配connect的行,把YES替換成NO [root@jie1 ~]# sed -i 's/bin/tom/2g' test #把全部匹配到bin的行中第二次及第二次以後出現bin替換成tom [root@jie1 ~]# sed -i 's/daemon/jerry/2p' test #把全部匹配到bin的行中第二次出現的daemon替換成jerry,並在生產與匹配行一樣的行 [root@jie1 ~]# sed -i 's/adm/boss/2' test #把全部匹配到adm的行中僅僅只是第二次出現的adm替換成boss [root@jie1 ~]# sed -i '/root/{s/bash/nologin/;s/0/1/g}' test #匹配root的行,把bash替換成nologin,且把0替換成1 [root@jie1 ~]# sed -i 's/root/(&)/g' test #把root用括號括起來,&表示引用前面匹配的字符 [root@jie1 ~]# sed -i 's/BOOTPROTO/#BOOTPROTO/' test #匹配BOOTPROTO替換成#BOOTPROTO,在配置文件中通常用於註釋某行 [root@jie1 ~]# sed -i 's/ONBOOT/#&/' test #匹配ONBOOT的行的前面添加#號,在配置文件中也表示註釋某行 [root@jie1 ~]# sed -i '/ONBOOT/s/#//' test #匹配ONBOOT的行,把#替換成空,即去掉#號,也通常用做去掉#註釋 #================執行以上sed命令以後文件顯示的內容==================== [root@jie1 ~]# cat test anonymous_enable=YES write_enable=YES local_umask=022 xferlog_enable=YES connect_from_port_20=NO (root):x:1:1:(root):/(root):/bin/nologin bin:x:1:1:tom:/tom:/stom/nologin daemon:x:2:2:jerry:/sbin:/stom/nologin daemon:x:2:2:jerry:/sbin:/stom/nologin adm:x:3:4:boss:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin Ethernet #BOOTPROTO="dhcp" HWADDR="00:0C:29:90:79:78" ONBOOT="yes" IPADDR=172.16.10.12 NETMASK=255.255.0.0
sed引用變量:(在自動化shell腳本 中也常常會使用到變量)
第一種當sed命令裏面沒有默認的變量時能夠把單引號改爲雙引號;
第二種當sed命令裏面有默認的變量時,那本身定義的變量須要加單引號,且sed裏面的語句必須用單引
[root@jie1 ~]# cat >> myfile << EOF > hello world > i am jie > how are you > EOF #先生成一個文件 [root@jie1 ~]# cat myfile hello world i am jie how are you [root@jie1 ~]# name=li #定義一個變量,且給變量賦值 [root@jie1 ~]# sed -i "s/jie/$name/" myfile #把匹配jie的字符替換成變量的值 [root@jie1 ~]# cat myfile hello world i am li how are you [root@jie1 ~]# sed -i "$a $name" myfile #當sed命令也有默認變量時,在去引用本身定義的變量會出現語法錯誤 sed: -e expression #1, char 3: extra characters after command [root@jie1 ~]# sed -i '$a '$name'' myfile #在引用自定義的變量時,sed語句必須用單引引住,而後把自定義的變量也用單引號引住 [root@jie1 ~]# cat myfile hello world i am li how are you li [root@jie1 ~]#
sed的其它高級使用:
1)把正在用sed操做的文件的內容寫到例外一個文件中
[root@jie1 ~]# cat test #sed操做的文件中的內容 Ethernet #BOOTPROTO="dhcp" HWADDR="00:0C:29:90:79:78" ONBOOT="yes" IPADDR=172.16.10.12 NETMASK=255.255.0.0 [root@jie1 ~]# sed -i 's/IPADDR/ip/w ip.txt' test #把sed操做的文件內容保存到另一個文件中,w表示保存,ip.txt文件名 [root@jie1 ~]# cat ip.txt #查看新文件的內容 ip=172.16.10.12 [root@jie1 ~]#
2)讀取一個文件到正在用sed操做的文件中
[root@jie1 ~]# cat myfile #文件內容 hello world i am li how are you li [root@jie1 ~]# cat test #將用sed操做的文件的內容 Ethernet #BOOTPROTO="dhcp" HWADDR="00:0C:29:90:79:78" ONBOOT="yes" IPADDR=172.16.10.12 NETMASK=255.255.0.0 [root@jie1 ~]# sed -i '/Ethernet/r myfile' test #在匹配Ethernet的行,讀進來另外一個文件的內容,讀進來的文件的內容會插入到匹配Ethernet的行後 [root@jie1 ~]# cat test #再次查看用sed命令操做的行 Ethernet hello world i am li how are you li #BOOTPROTO="dhcp" HWADDR="00:0C:29:90:79:78" ONBOOT="yes" IPADDR=172.16.10.12 NETMASK=255.255.0.0 [root@jie1 ~]#
sed的經典例子:
##1)、處理如下文件內容,將域名取出並進行計數排序,如處理: http://www.baidu.com/index.html http://www.baidu.com/1.html http://post.baidu.com/index.html http://mp3.baidu.com/index.html http://www.baidu.com/3.html http://post.baidu.com/2.html 獲得以下結果: 域名的出現的次數 域名 3 www.baidu.com 2 post.baidu.com 1 mp3.baidu.com [root@localhost shell]# cat file | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn 3 www.baidu.com 2 post.baidu.com 1 mp3.baidu.com [root@codfei4 shell]# awk -F/ '{print $3}' file |sort -r|uniq -c|awk '{print $1"\t",$2}' 3 www.baidu.com 2 post.baidu.com 1 mp3.baidu.com ##2)、用grep結合sed取出網卡的ip地址 [root@jie1 ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e 'N;s/\(eth[0-9]\).*\n.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\).*/\1 \2/p'
學會sed的使用是寫自動化shell腳本的基礎,sed也是一個很是有用且重要的命令,是文本處理工具之一,以上是我本身學習總結的sed命令簡單的用法,sed還有更高級的用法,也還在學習中。