Linux文本處理命令

做爲一名 Linux 研發人員,幾乎天天都要面對文本處理場景。 所以 掌握文本處理套路熟練運用文本處理命令 ,對於 提高工做效率 意義重大。html

原文地址:learn-linux.readthedocs.io
QQ交流羣:玩轉Linux,羣號:278378501
歡迎關注咱們的公衆號:小菜學編程 (coding-fan)python

本文以一個實戰例子拋磚引玉,介紹如何運用 grepawksedcut 等命令進行文本處理, 以 快速 完成本來很繁瑣的操做。linux

背景

筆者開發機上有不少 Docker 鏡像,如今須要刪除名爲 none 的那些:golang

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB
golang              1.10                0a19f4d16598        12 days ago         729MB
python              3                   1e80caffd59e        12 days ago         923MB
複製代碼

如何操做呢?莫非手工一個個刪除麼?docker

$ docker image rm f0fa889be9e8
複製代碼

試想,若是有上百個這樣的鏡像待刪,要搞到何年何月!但如何改進呢?shell

文本過濾

考慮先把名字爲 none 的鏡像從結果中過濾出來, grep 命令便可搞定:編程

$ docker images | grep none
<none>              <none>              f0fa889be9e8        2 days ago          956MB
<none>              <none>              257954316455        2 days ago          956MB
<none>              <none>              99739acbfe7a        2 days ago          956MB
<none>              <none>              52b10754a70c        2 days ago          956MB
<none>              <none>              86878eefdd39        2 days ago          956MB
複製代碼

字段提取

接着,將容器 ID 一列提取出來,這對 awk 來講簡直是小兒科:api

$ docker images | grep none | awk '{print $3}'
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
複製代碼

固然了,經過 cut 命令進行 字段切分 也能夠獲得相同的結果。 因爲 cut 只能按單個字符進行切分,而原文本中的空格爲多個,所以須要先進行 文本替換bash

文本替換

文本替換是 sed 命令擅長的事,下面將一個或多個空格替換成一個:微信

$ docker images | grep none | sed 's/ */ /g'
<none> <none> f0fa889be9e8 2 days ago 956MB
<none> <none> 257954316455 2 days ago 956MB
<none> <none> 99739acbfe7a 2 days ago 956MB
<none> <none> 52b10754a70c 2 days ago 956MB
<none> <none> 86878eefdd39 2 days ago 956MB
複製代碼

文本切分

接下來,使用 cut 命令對結果進行進一步切分並取出第三個字段:

$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3
f0fa889be9e8
257954316455
99739acbfe7a
52b10754a70c
86878eefdd39
複製代碼

不錯,咱們獲得與運用 awk 命令相同的結果。

批量刪除

接下來,經過 xargs 批量刪除鏡像:

$ docker images | grep none | awk '{print $3}' | xargs docker image rm
Deleted: sha256:f0fa889be9e8f8369353a32e8cec17e9333cbeb581de5f78bf6875917d971bc9
Deleted: sha256:d301d0546b29b7daa55d29f29d9253664870fd83465aefe8b92ff6a7048d5612
...
複製代碼

在這個例子中, xargs 最終將執行如下命令:

$ docker image rm f0fa889be9e8 257954316455 99739acbfe7a 52b10754a70c 86878eefdd39
複製代碼

看到沒有,全部不想要的鏡像都刪除乾淨了,並且只須要進行一次操做:

$ docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
api-adapter         v1                  e9bc8e28af2a        3 hours ago         7.67MB
golang              1.10                0a19f4d16598        12 days ago         729MB
python              3                   1e80caffd59e        12 days ago         923MB
複製代碼

下面這個操做也是等價的:

$ docker images | grep none | sed 's/ */ /g' | cut -d ' ' -f 3 | xargs docker image rm
複製代碼

訂閱更新,獲取更多學習資料,請關注咱們的 微信公衆號 :

小菜學編程
相關文章
相關標籤/搜索