乾貨！上古神器 sed 教程詳解，小白也能看的懂

時間 2021-01-25

標籤 html 正則表達式編程 vim 緩存 bash app 負載均衡編輯器函數欄目 Linux 简体版

原文原文鏈接

目錄：html

介紹工做原理正則表達式基本語法數字定址和正則定址基本子命令實戰練習正則表達式

介紹

熟悉 Linux 的同窗必定知道大名鼎鼎的 Linux 三劍客，它們是 grep、awk、sed，咱們今天要聊的主角就是 sed。編程

sed 全名叫 stream editor，流編輯器，用程序的方式來編輯文本，與 vim 的交互式編輯方式大相徑庭。它的功能十分強大，加上正則表達式的支持，能夠進行大量的複雜文本的編輯操做。vim

實際上 sed 提供的功能很是複雜，有專門的書籍講解它。本文不會講 sed 的所有東西，只會從 sed 的工做原理、常見使用方法等方面進行說明和講解，同時也會給出大量的實踐用例來幫助更好的理解 sed 基本用法。文中的知識點真正掌握後，足以應付平時工做中的基本需求。緩存

它有本身的使用場景：bash

自動化程序中，不適合交互方式編輯的；
大批量重複性的編輯需求；
編輯命令太過複雜，在交互文本編輯器難以輸入的狀況；

工做原理

sed 做爲一種非交互式編輯器，它使用預先設定好的編輯指令對輸入的文本進行編輯，完成以後輸出編輯結果。app

簡單描述 sed 工做原理：負載均衡

sed 從輸入文件中讀取內容，每次處理一行內容，並把當前的一行內容存儲在臨時的緩衝區中，稱爲 模式空間。
接着用 sed 命令處理緩存區中的內容；
處理完畢後，把緩存區的內容送往屏幕；
接着處理下一行；

這樣不斷重複，直到文件末尾，文件內容並無改變，除非你使用重定向輸出或指定了 i 參數編輯器

正則表達式

sed 基本上就是在玩正則表達式模式匹配，因此，會玩 sed 的人，正則表達式能力通常都比較強。正則表達式內容相對較多，本節不會重點講解正則表達式。函數

爲了可以讓大部分朋友比較輕鬆地學習本文知識，這裏仍是簡單介紹下正則表達式的基本內容。若是是專門作正則編程開發的，能夠去買本正則的書籍來看。

（一）基本正則表達式

.，表示匹配任意一個字符，除了換行符，相似 Shell 通配符中的 ?；
*，表示前邊字符有 0 個或多個；
.*，表示任意一個字符有 0 個或多個，也就是能匹配任意的字符；
^，表示行首，也就是每一行的開始位置，^abc 匹配以 abc 開頭的字符串；
$，表示行尾，也就是每一行的結尾位置，}$ 匹配以大括號結尾的字符串；
{}，表示前邊字符的數量範圍，{2}，表示重複 2 次，{2,}重複至少 2次，{2,4} 重複 2-4 次；
[]，括號中能夠包含表示字符集的表達式，使用方法大概以下幾種

（二）擴展正則表達式

擴展正則表達式使用頻率上沒有基本表達式那麼高，但依然很重要，不少狀況下沒有擴展正則是搞不定的，sed 命令使用擴展正則時須要加上選項 -r。

?：表示前置字符有 0 個或 1 個；
+：表示前置字符有 1 個或多個；
|：表示匹配其中的一項便可；
()：表示分組，(a|b)b 表示能夠匹配 ab 或 bb 子串，且命令表達式中能夠經過 \1、\2 來表示匹配的變量
{}：和基本正則中的大括號中意義相同，只不過使用時不用加轉義符號；

基本語法

先介紹下 sed 的基本語法。

sed [選項] 'command' filename

選項部分，常見選項包括：-n、-e、-i、-f、-r 等。

command 子命令格式：

[地址1, 地址2] [函數] [參數(標記)]

選項簡單說明：

-n，表示安靜模式。默認 sed 會把每行內容處理完畢後打印到屏幕上，加上選項後就不會輸出到屏幕上。
-e，若是須要用 sed 對文本內容進行多種操做，則須要執行多條子命令來進行操做；
-i，默認 sed 只會處理模式空間的副本內容，不會直接修改文件，若是須要修改文件，就要指定 -i 選項；
-f，若是命令操做比較多時，用 -e 會有點力不從心，這時須要把多個子命令寫入腳本文件，使用 -f 選項指定執行該腳本；
-r：若是須要支持擴展正則表達式，那麼須要添加 -r 選項；

數字定址和正則定址

默認狀況下 sed 會對每一行內容進行匹配、處理、輸出，有時候咱們不須要對全部內容進行操做，只須要修改一種一部分，好比 1-10 行，偶數行，或包括 hello 字符串的行。

這種狀況下，就須要咱們去定位特定的行來進行處理，而不是所有內容，這裏把定位指定的行叫作定址。

（一）數字定址

數字定址其實就是經過數字去指定要操做的行，有幾種方式，每種方式都有不一樣的應用場景。

# 只將第4行中hello替換爲A
$ sed '4s/hello/A/g' file.txt
# 將第2-4行中hello替換爲A
$ sed '2,4s/hello/A/g' file.txt
# 從第2行開始，往下數4行，也就是2-6行
$ sed '2,+4s/hello/A/g' file.txt
# 將最後1行中hello替換爲A
$ sed '$s/hello/A/g' file.txt
# 除了第1行，其它行將hello替換爲A
$ sed '1!s/hello/A/g' file.txt

（二）正則定址

正則定址，是經過正則表達式的匹配來肯定須要處理編輯哪些行，其它行就不須要處理

# 將匹配到hello的行執行刪除操做，d 表示刪除
$ sed '/hello/d' file.txt
# 刪除空行，"^$" 表示空行
$ sed '/^$/d' file.txt
# 將匹配到以ts開頭的行到以te開頭的行之間全部行進行刪除
$ sed '/^ts/,/^te/d' file.txt

（三）數字定址和正則定址混用

數字定址和正則定址能夠配合使用

# 匹配從第1行到ts開頭的行，把匹配的行執行刪除
$ sed '1,/^ts/d' file.txt

基本子命令

（一）替換子命令s

子命令 s 爲替換子命令，是平時 sed 使用最多的命令，由於支持正則表達式，功能很強大，基本能夠替代 grep 的基本用法。

基本語法：

[address]s/pat/rep/flags

替換子命令基本用法

# 將每行的hello替換爲HELLO，只替換匹配到的第一個
$ sed 's/hello/HELLO/' file.txt

# 將匹配到的hello所有替換爲HELLO，g表示替換一行全部匹配到的
$ sed 's/hello/HELLO/g' file.txt

# 將第2次匹配到的hello替換
$ sed 's/hello/A/2' file.txt

# 將第2次後匹配到的全部都替換
$ sed 's/hello/A/2g' file.txt

# 在行首加#號
$ sed 's/^/#/g' file.txt

# 在行尾加東西
$ sed 's/$/xxx/g' file.txt

正則表達式的簡單使用

# 使用擴展正則表達式，結果爲：A
$ echo "hello 123 world" | sed -r 's/[a-z]+ [0-9]+ [a-z]+/A/'

# <b>This</b> is what <span style="x">I</span> meant
# 要求：去掉上述html文件中的tags
$ sed 's/<[^>]*>//g' file.txt

多個匹配

# 將1-3行的my替換爲your，且3行之後的This替換爲That
$ sed '1,3s/my/your/g; 3,$s/This/That/g' my.txt

# 等價於
$ sed -e '1,3s/my/your/g' -e '3,$s/This/That/g' my.txt

使用匹配到的變量

# 將匹配到的字符串先後加雙引號，結果爲：My "name" chopin
# "&"表示匹配到的整個結果集
$ echo "My name chopin" | sed 's/name/"&"/'

# 以下命令，結果爲：hello=world，"\1"和"\2"表示圓括號匹配到的值
$ echo "hello,123,world" | sed 's/\([^,]\),.*,\(.*\)/\1=\2/'

其它幾個常見用法

# 只將修改匹配到行內容打印出來，-n關閉了模式空間的打印模式
$ sed -n 's/i/A/p' file.txt

# 替換是忽略大小寫，將大小寫i替換爲A
$ sed -n 's/i/A/i' file.txt

# 將替換後的內容另存爲一個文件
$ sed -n 's/i/A/w b.txt' file.txt
$ sed -n 's/i/A/' file.txt > b.txt

注意，sed 修改匹配到的內容後，默認行爲是不保存到原文件，直接輸出修改後模式空間的內容，若是要修改原文件須要指定 -i 選項。

（二）追加行子命令a

子命令 a 表示在指定行下邊插入指定的內容行；

# 將全部行下邊都添加一行內容A
$ sed 'a A' file.txt

# 將文件中1-2行下邊都添加一行內容A
$ sed '1,2a A' file.txt

（三）插入行子命令i

子命令 i 和 a 使用基本同樣，只不過是在指定行上邊插入指定的內容行

# 將文件中1-2行上邊都添加一行內容A
$ sed '1,2i A'

（四）替換行子命令c

子命令 c 是表示把指定的行內容替換爲本身須要的行內容

# 將文件全部行都分別替換爲A
$ sed 'c A' file.txt

# 將文件中1-2行內容替換爲A，注意：兩行內容變成了一行A
$ sed '1,2c A' file.txt

# 將1-2行內容分別替換爲A行內容
$ sed '1,2c A\nA' file.txt

（五）刪除行子命令d

子命令 d 表示刪除指定的內容行，這個很容理解

# 將文件中1-3行內容刪除
$ sed '1,3d' file.txt

# 將文件中This開頭的行內容刪除
$ sed '/^This/d' file.txt

（六）設置行號子命令=

子命令 =，能夠將行號打印出來

# 將指定行上邊顯示行號
$ sed '1,2=' file.txt

# 能夠將行號設置在行首
$ sed '=' file.txt | sed 'N;s/\n/\t/'

（七）子命令N

子命令 N，把下一行內容歸入當緩存區作匹配，注意的是第一行的 \n 仍然保留

其實就是當前行的下一行內容也讀進緩存區，一塊兒作匹配和修改，舉個例子吧

# 將偶數行內容合併到奇數行
$ sed 'N;s/\n//' file.txt

哈哈，是否是很簡單？

實戰練習

掌握了上邊的基礎命令操做後，基本上能夠知足平時 95% 的需求啦。sed 還有一些高級概念，好比：模式空間、保持空間、高級子命令、分支和測試等，平時使用機率很是小，本文就暫不講解了，有須要的同窗能夠私信我一塊兒交流學習哈。

學習了這麼多基礎用法後，只要你勤加練習，多實踐，多使用，必定能夠駕輕就熟，極大提升的文本處理效率。下邊我簡單再給出一些比較實用的操做實踐，但願對你們有幫助。

1. 刪除文件每行的第二個字符

$ sed -r 's/(.)(.)(.*)$/\1\3/' file.txt

2. 交換每行的第一個字符和第二個字符

$ sed -r ‘s/(.)(.)(.*)/\2\1\3/’ file.txt

3. 刪除文件中全部的數字

$ sed 's/[0-9]//g' file.txt

4. 用製表符替換文件中出現的全部空格

$ sed -r 's/ +/\t/g' file.txt

5. 把全部大寫字母用括號()括起來

$ sed -r 's/([A-Z])/(\1)/g'

6. 隔行刪除

$ sed '0~2{d}' file.txt

7. 刪除全部空白行

$ sed '/^$/d' file.txt

好了，以上是 sed 命令經常使用的所有內容。想要熟練掌握，只有多實踐，多練習正則表達式的使用，一旦熟練掌握後，相信在往後工做中必定會產生巨大做用的。

謝謝你們，我是肖邦，歡迎關注後續的精彩內容。