輕鬆學會文本處理工具之二 sed

                    文本處理工具之二 sed命令詳解html


      sed:Stream Editor文本流編輯,sed是一個「非交互式的」面向字符流的編輯器。能同時處理多個文件多行的內容,能夠不對原文件改動,把整個文件輸入到屏幕,能夠把只匹配到模式的內容輸入到屏幕上。還能夠對原文件改動,可是不會再屏幕上返回結果。git

sed命令的語法格式:正則表達式

       sed的命令格式: sed [option]  'sed command'filenameshell

sed的腳本格式:sed [option] -f  'sed  script'filenameexpress

sed命令的選項(option)bash

                -n :只打印模式匹配的行編輯器

-e :直接在命令行模式上進行sed動做編輯,此爲默認選項ide

-f :將sed的動做寫在一個文件內,用f  filename 執行filename內的sed動做工具

-r :支持擴展表達式post

-i 直接修改文件內容

sed在文件中查詢文本的方式:

1)使用行號,能夠是一個簡單數字,或是一個行號範圍

 x                                  

x爲行號

x,y

表示行號從x到y

/pattern

查詢包含模式的行

/pattern   /pattern

查詢包含兩個模式的行

pattern/,x  

在給定行號上查詢包含模式的行

x,/pattern/  

經過行號和模式查詢匹配的行

x,y!  

查詢不包含指定行號x和y的行


2)使用正則表達式、擴展正則表達式(必須結合-r選項)  

^

錨點行首的符合條件的內容,用法格式"^pattern"

$

錨點行首的符合條件的內容,用法格式"pattern$"

^$

空白行

.

匹配任意單個字符

*

匹配緊挨在前面的字符任意次(0,1,屢次)

.*

匹配任意長度的任意字符

\?

匹配緊挨在前面的字符0次或1次

\{m,n\}

匹配其前面的字符至少m次,至多n次

\{m,\}

匹配其前面的字符至少m次

\{m\}

精確匹配前面的m次\{0,n\}:0到n次          

\<

錨點詞首----至關於  \b,用法格式:\<pattern

\>

錨點詞尾,用法格式:\>pattern

\<pattern\>

單詞錨點

\(\)

分組,用法格式:\(pattern\),引用\1,\2

[]

匹配指定範圍內的任意單個字符

[^]

匹配指定範圍外的任意單個字符

[:digit:]

全部數字,  至關於0-9, [0-9]--->  [[:digit:]]

[:lower:]

全部的小寫字母

[:upper:]

全部的大寫字母

[:alpha:]

全部的字母

[:alnum:]

至關於0-9a-zA-Z

[:space:]

空白字符

[:punct:]

全部標點符號

#######sed的匹配模式支持正則表達式#####################
sed'5 q'/etc/passwd#打印前5行
sed-n '/r*t/p'/etc/passwd#打印匹配r有0個或者多個,後接一個t字符的行
sed-n '/.r.*/p'/etc/passwd#打印匹配有r的行而且r後面跟任意字符
sed-n '/o*/p'/etc/passwd#打印o字符重複任意次
sed-n '/o\{1,\}/p'/etc/passwd#打印o字重複出現一次以上
sed-n '/o\{1,3\}/p'/etc/passwd#打印o字重複出現一次到三次之間以上

   sed的編輯命令(sed  command)

p

打印匹配行(和-n選項一塊兒合用)

=

顯示文件行號

a\  

在定位行號後附加新文本信息

i\

在定位行號後插入新文本信息

d    

刪除定位行

c\  

用新文本替換定位文本

w filename

寫文本到一個文件,相似輸出重定向 >

r    filename

從另外一個文件中讀文本,相似輸入重定向  <

s

使用替換模式替換相應模式

q

第一個模式匹配完成後退出或當即退出

l

顯示與八進制ACSII代碼等價的控制符

{}

在定位行執行的命令組,用分號隔開

n  

從另外一個文件中讀文本下一行,並從下一條命令而不是第一條命令開始對其的處理

N

在數據流中添加下一行以建立用於處理的多行組

g

將模式2粘貼到/pattern n/

y    

傳送字符,替換單個字符


對文件的操做無非就是」增刪改查「,怎樣用sed命令實現對文件的」增刪改查「,玩轉sed是寫自動化腳本必須的基礎之一。

sed命令打印文件信息(查詢):

####用sed打印文件的信息的例子的命令######
sed -n '/^#/!p'  /etc/vsftpd/vsftpd.conf       
sed -n '/^#/!{/^$/!p}'  /etc/vsftpd/vsftpd.conf
sed -e '/^#/d' -e '/^$/d'  /etc/vsftpd/vsftpd.conf
sed -n '1,/adm/p' /etc/passwd
sed -n '/adm/,6p' /etc/passwd
sed -n '/adm/,4p' /etc/passwd
sed -n '/adm/,2p' /etc/passwd
###如下圖片是對這些sed命令例子的解釋和顯示結果

sed命令實現對文件內容的添加:(對源文件添加的話就用-i參數):

####sed命令能夠實現的添加######
#1)匹配行的行首添加,添加在同行
#2)匹配行的行中的某個字符後添加
#3)匹配行的行尾添加字符
#4)匹配行的行前面行添加
#5)匹配行的行後面行添加
#6)文件的行首添加一行
  [root@jie1 ~]# sed -i '1 i\sed command start' myfile
#7)文件的行尾追加一行
  [root@jie1 ~]# sed -i '$a \sed command end' myfile




sed命令實現對文件內容的刪除:(對源文件直接刪除用-i參數):

sed的刪除操做是針對文件的行,若是想刪除行中的某個字符,那就用替換(別急,替換稍後就講,並且替換是sed最經常使用的)


重點sed命令實現對文件內容的替換(替換是在shell自動化腳本中用到最多的操做)


#================源文件裏面的內容===============================
[root@jie1 ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=YES
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
DEVICE="eth0"
BOOTPROTO="static"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.22.1
NETMASK=255.255.0.0
#======================================================================
[root@jie1 ~]# sed -i '/DEVICE/c\Ethernet' test 
        #匹配DEVICE的行,替換成Ethernet這行
[root@jie1 ~]# sed -i 's/static/dhcp/' test     
        #把static替換成dhcp(/,@,#都是前面所說的地址定界符)
[root@jie1 ~]# sed -i '/IPADDR/s@22\.1@10.12@' test
        #匹配IPADDR的行,把22.1替換成10.12因爲.號有特殊意義全部須要轉義
[root@jie1 ~]# sed -i '/connect/s#YES#NO#' test 
        #匹配connect的行,把YES替換成NO
[root@jie1 ~]# sed -i 's/bin/tom/2g' test       
        #把全部匹配到bin的行中第二次及第二次以後出現bin替換成tom
[root@jie1 ~]# sed -i 's/daemon/jerry/2p' test  
        #把全部匹配到bin的行中第二次出現的daemon替換成jerry,並在生產與匹配行一樣的行
[root@jie1 ~]# sed -i 's/adm/boss/2' test       
        #把全部匹配到adm的行中僅僅只是第二次出現的adm替換成boss
[root@jie1 ~]# sed -i '/root/{s/bash/nologin/;s/0/1/g}' test
        #匹配root的行,把bash替換成nologin,且把0替換成1
[root@jie1 ~]# sed -i 's/root/(&)/g' test                 
        #把root用括號括起來,&表示引用前面匹配的字符
[root@jie1 ~]# sed -i 's/BOOTPROTO/#BOOTPROTO/' test      
        #匹配BOOTPROTO替換成#BOOTPROTO,在配置文件中通常用於註釋某行
[root@jie1 ~]# sed -i 's/ONBOOT/#&/' test                 
        #匹配ONBOOT的行的前面添加#號,在配置文件中也表示註釋某行
[root@jie1 ~]# sed -i '/ONBOOT/s/#//' test                
        #匹配ONBOOT的行,把#替換成空,即去掉#號,也通常用做去掉#註釋
#================執行以上sed命令以後文件顯示的內容====================
[root@jie1 ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=NO
(root):x:1:1:(root):/(root):/bin/nologin
bin:x:1:1:tom:/tom:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
adm:x:3:4:boss:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0


sed引用變量:(在自動化shell腳本 中也常常會使用到變量

     第一種當sed命令裏面沒有默認的變量時能夠把單引號改爲雙引號;  

     第二種當sed命令裏面有默認的變量時,那本身定義的變量須要加單引號,且sed裏面的語句必須用單引

[root@jie1 ~]# cat >> myfile << EOF
> hello world
> i am jie
> how are you
> EOF   #先生成一個文件
[root@jie1 ~]# cat myfile
hello world
i am jie
how are you
[root@jie1 ~]# name=li
         #定義一個變量,且給變量賦值
[root@jie1 ~]# sed -i "s/jie/$name/" myfile
         #把匹配jie的字符替換成變量的值
[root@jie1 ~]# cat myfile
hello world
i am li
how are you
[root@jie1 ~]# sed -i "$a $name" myfile
          #當sed命令也有默認變量時,在去引用本身定義的變量會出現語法錯誤
sed: -e expression #1, char 3: extra characters after command
[root@jie1 ~]# sed -i '$a '$name'' myfile
          #在引用自定義的變量時,sed語句必須用單引引住,而後把自定義的變量也用單引號引住
[root@jie1 ~]# cat myfile
hello world
i am li
how are you
li
[root@jie1 ~]#


sed的其它高級使用:

1)把正在用sed操做的文件的內容寫到例外一個文件中

[root@jie1 ~]# cat test   #sed操做的文件中的內容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]# sed -i 's/IPADDR/ip/w ip.txt' test
       #把sed操做的文件內容保存到另一個文件中,w表示保存,ip.txt文件名
[root@jie1 ~]# cat ip.txt  #查看新文件的內容
ip=172.16.10.12
[root@jie1 ~]#

2)讀取一個文件到正在用sed操做的文件中

[root@jie1 ~]# cat myfile   #文件內容
hello world
i am li
how are you
li
[root@jie1 ~]# cat test  #將用sed操做的文件的內容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]# sed  -i '/Ethernet/r myfile' test
      #在匹配Ethernet的行,讀進來另外一個文件的內容,讀進來的文件的內容會插入到匹配Ethernet的行後
[root@jie1 ~]# cat test  #再次查看用sed命令操做的行
Ethernet
hello world
i am li
how are you
li
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[root@jie1 ~]#


sed的經典例子:

##1)、處理如下文件內容,將域名取出並進行計數排序,如處理:
http://www.baidu.com/index.html
http://www.baidu.com/1.html
http://post.baidu.com/index.html
http://mp3.baidu.com/index.html
http://www.baidu.com/3.html
http://post.baidu.com/2.html
獲得以下結果:
域名的出現的次數 域名
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[root@localhost shell]# cat file | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[root@codfei4 shell]# awk -F/ '{print $3}' file |sort -r|uniq -c|awk '{print $1"\t",$2}'
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
##2)、用grep結合sed取出網卡的ip地址
[root@jie1 ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e 'N;s/\(eth[0-9]\).*\n.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\).*/\1 \2/p'


 學會sed的使用是寫自動化shell腳本的基礎,sed也是一個很是有用且重要的命令,是文本處理工具之一,以上是我本身學習總結的sed命令簡單的用法,sed還有更高級的用法,也還在學習中。

相關文章
相關標籤/搜索