文本處理「三劍客」之SED」正則表達式
1、SED行編輯器express
sed是stream editor的簡稱,Sed本質上是一個編輯器,可是它是非交互式的流編輯器。緩存
sed的處理流程:編輯器
1.讀入一行內容到模式空間(Pattern Space)ide
2.對模式空間裏的內容執行sed命令spa
3.輸出模式空間的內容,當輸出內容後,模式空間將被清空regexp
4重複以上的操做,直到文件的最後一行。blog
2、sed命令的語法:ip
sed [OPTION]...'script' [input-file] ...ci
script:地址定界編輯命令
經常使用選項[OPTION]:
-n:不輸出模式空間中的內容至屏幕;
-e script, --expression=script:多點編輯;
-f /PATH/TO/SED_SCRIPT_FILE
每行一個編輯命令;
-r, --regexp-extended:支持使用擴展正則表達式;
-i[SUFFIX], --in-place[=SUFFIX]:直接編輯原文件 ;
地址定界:
1) 空地址:對全文進行處理;
2) 單地址:#:指定行;
/pattern/:被此模式所匹配到的每一行;
3) 地址範圍
#,#:從起始行到結束行
#,+#:如3,8指從第三行(包含第三行),向下八行。
#,/pat1/:從第#行開始到能第一次被模式匹配到行結束。
/pat1/,/pat2/:從能被模式1匹配到行開始到能被模式2匹配到的行結束。
$:最後一行;
4) 步進:~
1~2:全部奇數行
2~2:全部偶數行
編輯命令:
d:刪除;刪除被模式匹配到行即一、三、5行;
p:顯示模式空間中的內容;被模式匹配到的行顯示兩次。
a \text:在行後面追加文本「text」,支持使用\n實現多行追加;
i \text:在行前面插入文本「text」,支持使用\n實現多行插入;
c \text:把匹配到的行替換爲此處指定的文本「text」;第一行被替換爲"new line"。
w /PATH/TO/SOMEFILE:保存模式空間匹配到的行至指定的文件中;
把"sedtest.txt"中不是#號開頭的行,保存到"newsed.txt"中。
r /PATH/FROM/SOMEFILE:讀取指定文件的內容至當前文件被模式匹配到的行後面;文件合併;
把"newsed.txt"中的內容追加到"sedtest.txt"第6行的後邊。
=:爲模式匹配到的行打印行號;
s///:查找替換,其分隔符可自行指定,經常使用的有s@@@, s###等;替換標記:
g:全局替換;
w /PATH/TO/SOMEFILE:將替換成功的結果保存至指定文件中;
p:顯示替換成功的行;
練習1:將/etc/grub2.cfg文件中全部以空白字符開頭的行的行首的空白字符替換成「magedu」;
練習2:輸出一個絕對路徑給sed命令,取出其目錄,其行爲相似於dirname;
3、高級編輯命令:
另一個緩存空間——保持空間(Hold Space),保持空間用於保存模式空間的內容,模式空間的內容能夠複製到保持空間,一樣地保持空間的內容能夠複製回模式空間。
h:把模式空間中的內容覆蓋至保持空間中;
H:把模式空間中的內容追加至保持空間中;
g:把保持空間中的內容覆蓋至模式空間中;
G:把保持空間中的內容追加至模式空間中;
x:把模式空間中的內容與保持空間中的內容互換;
n:覆蓋讀取匹配到的行的下一行至模式空間中;
N:追加讀取匹配到的行的下一行至模式空間中;
d:刪除模式空間中的行;
D:刪除多行模式空間中的全部行;
示例:
sed -n 'n;p' FILE:顯示偶數行;
sed '1!G;h;$!d' FILE:逆序顯示文件的內容;
sed '$!d' FILE:取出最後一行;
sed '$!N;$!D' FILE:取出文件後兩行;
sed '/^$/d;G' FILE:刪除原有的全部空白行,然後爲全部的非空白行後添加一個空白行;
sed 'n;d' FILE:顯示奇數行;
sed 'G' FILE:在原有的每行後方添加一個空白行;