Unix 高手的10個好習慣

時間 2020-08-11

標籤 unix 高手習慣欄目 Unix 简体版

原文原文鏈接

引言html

當您常用某個系統時，每每會陷入某種固定的使用模式。有時，您沒有養成以儘量最好的方式作事的習慣。有時，您的不良習慣甚至會致使出現混亂。糾正此類缺點的最佳方法之一，就是有意識地採用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 UNIX 命令行習慣——幫助您克服許多常見使用怪癖，並在該過程當中提升命令行工做效率的好習慣。下面列出了這 10 個好習慣，以後對進行了更詳細的描述。shell

採用 10 個好習慣

要採用的十個好習慣爲：工具

在單個命令中建立目錄樹。
更改路徑；不要移動存檔。
將命令與控制操做符組合使用。
謹慎引用變量。
使用轉義序列來管理較長的輸入。
在列表中對命令分組。
在 find 以外使用 xargs。
瞭解什麼時候 grep 應該執行計數——什麼時候應該繞過。
匹配輸出中的某些字段，而不僅是對行進行匹配。
中止對 cat 使用管道。

1.在單個命令中建立目錄樹

清單 1 演示了最多見的 UNIX 壞習慣之一：一次定義一個目錄樹。測試

清單 1. 壞習慣 1 的示例：單獨定義每一個目錄樹

~ $ mkdir tmp
~ $ cd tmp
~/tmp $ mkdir a
~/tmp $ cd a
~/tmp/a $ mkdir b
~/tmp/a $ cd b
~/tmp/a/b/ $ mkdir c
~/tmp/a/b/ $ cd c
~/tmp/a/b/c $

使用 mkdir 的 -p 選項並在單個命令中建立全部父目錄及其子目錄要容易得多。可是即便對於知道此選項的管理員，他們在命令行上建立子目錄時也仍然束縛於逐步建立每級子目錄。花時間有意識地養成這個好習慣是值得的：命令行

清單 2. 好習慣 1 的示例：使用一個命令來定義目錄樹

~ $ mkdir -p tmp/a/b/c

您可使用此選項來建立整個複雜的目錄樹（在腳本中使用是很是理想的），而不僅是建立簡單的層次結構。例如：unix

清單 3. 好習慣 1 的另外一個示例：使用一個命令來定義複雜的目錄樹

~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

過去，單獨定義目錄的惟一藉口是您的 mkdir 實現不支持此選項，可是在大多數系統上再也不是這樣了。IBM、AIX®、mkdir、GNU mkdir 和其餘遵照單一 UNIX 規範 (Single UNIX Specification) 的系統如今都具備此選項。code

對於仍然缺少該功能的少數系統，您可使用 mkdirhier 腳本（請參見參考資料），此腳本是執行相同功能的 mkdir 的包裝：htm

~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}

2.更改路徑；不要移動存檔

另外一個不良的使用模式是將 .tar 存檔文件移動到某個目錄，由於該目錄剛好是您但願在其中提取 .tar 文件的目錄。其實您根本不須要這樣作。您能夠爲所欲爲地將任何 .tar 存檔文件解壓縮到任何目錄——這就是 -C 選項的用途。在解壓縮某個存檔文件時，使用 -C 選項來指定要在其中解壓縮該文件的目錄：three

清單 4. 好習慣 2 的示例：使用選項 `-C` 來解壓縮 .tar 存檔文件

~ $ tar xvf -C tmp/a/b/c newarc.tar.gz

相對於將存檔文件移動到您但願在其中解壓縮它的位置，切換到該目錄，而後才解壓縮它，養成使用 -C 的習慣則更加可取——當存檔文件位於其餘某個位置時尤爲如此。ip

3.將命令與控制操做符組合使用

您可能已經知道，在大多數 Shell 中，您能夠在單個命令行上經過在命令之間放置一個分號 (;) 來組合命令。該分號是 Shell 控制操做符，雖然它對於在單個命令行上將離散的命令串聯起來頗有用，但它並不適用於全部狀況。例如，假設您使用分號來組合兩個命令，其中第二個命令的正確執行徹底依賴於第一個命令的成功完成。若是第一個命令未按您預期的那樣退出，第二個命令仍然會運行——結果會致使失敗。相反，應該使用更適當的控制操做符（本文將描述其中的部分操做符）。只要您的 Shell 支持它們，就值得養成使用它們的習慣。

僅當另外一個命令返回零退出狀態時才運行某個命令

使用 && 控制操做符來組合兩個命令，以便僅當第一個命令返回零退出狀態時才運行第二個命令。換句話說，若是第一個命令運行成功，則第二個命令將運行。若是第一個命令失敗，則第二個命令根本就不運行。例如：

清單 5. 好習慣 3 的示例：將命令與控制操做符組合使用

~ $ cd tmp/a/b/c && tar xvf ~/archive.tar

在此例中，存檔的內容將提取到 ~/tmp/a/b/c 目錄中，除非該目錄不存在。若是該目錄不存在，則 tar 命令不會運行，所以不會提取任何內容。

僅當另外一個命令返回非零退出狀態時才運行某個命令

相似地，|| 控制操做符分隔兩個命令，而且僅當第一個命令返回非零退出狀態時才運行第二個命令。換句話說，若是第一個命令成功，則第二個命令不會運行。若是第一個命令失敗，則第二個命令纔會運行。在測試某個給定目錄是否存在時，一般使用此操做符，若是該目錄不存在，則建立它：

清單 6. 好習慣 3 的另外一個示例：將命令與控制操做符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c

您還能夠組合使用本部分中描述的控制操做符。每一個操做符都影響最後的命令運行：

清單 7. 好習慣 3 的組合示例：將命令與控制操做符組合使用

~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar

4.謹慎引用變量

始終要謹慎使用 Shell 擴展和變量名稱。通常最好將變量調用包括在雙引號中，除非您有不這樣作的足夠理由。相似地，若是您直接在字母數字文本後面使用變量名稱，則還要確保將該變量名稱包括在方括號 ([]) 中，以使其與周圍的文本區分開來。不然，Shell 將把尾隨文本解釋爲變量名稱的一部分——而且極可能返回一個空值。清單 8 提供了變量的各類引用和非引用及其影響的示例。

清單 8. 好習慣 4 的示例：引用（和非引用）變量

~ $ ls tmp/
a b
~ $ VAR="tmp/*"
~ $ echo $VAR
tmp/a tmp/b
~ $ echo "$VAR"
tmp/*
~ $ echo $VARa

~ $ echo "$VARa"

~ $ echo "${VAR}a"
tmp/*a
~ $ echo ${VAR}a
tmp/a
~ $

5.使用轉義序列來管理較長的輸入

您或許看到過使用反斜槓 (\) 來將較長的行延續到下一行的代碼示例，而且您知道大多數 Shell 都將您經過反斜槓聯接的後續行上鍵入的內容視爲單個長行。然而，您可能沒有在命令行中像一般那樣利用此功能。若是您的終端沒法正確處理多行迴繞，或者您的命令行比一般小（例如在提示符下有長路經的時候），反斜槓就特別有用。反斜槓對於瞭解鍵入的長輸入行的含義也很是有用，如如下示例所示：

清單 9. 好習慣 5 的示例：將反斜槓用於長輸入

~ $ cd tmp/a/b/c || \
> mkdir -p tmp/a/b/c && \
> tar xvf -C tmp/a/b/c ~/archive.tar

或者，也可使用如下配置：

清單 10. 好習慣 5 的替代示例：將反斜槓用於長輸入

~ $ cd tmp/a/b/c \
>                 || \
> mkdir -p tmp/a/b/c \
>                    && \
> tar xvf -C tmp/a/b/c ~/archive.tar

然而，當您將輸入行劃分到多行上時，Shell 始終將其視爲單個連續的行，由於它老是刪除全部反斜槓和額外的空格。

注意：在大多數 Shell 中，當您按向上箭頭鍵時，整個多行輸入將重繪到單個長輸入行上。

6.在列表中對命令分組

大多數 Shell 都具備在列表中對命令分組的方法，以便您能將它們的合計輸出向下傳遞到某個管道，或者將其任何部分或所有流重定向到相同的地方。您通常能夠經過在某個 Subshell 中運行一個命令列表或經過在當前 Shell 中運行一個命令列表來實現此目的。

在 Subshell 中運行命令列表

使用括號將命令列表包括在單個組中。這樣作將在一個新的 Subshell 中運行命令，並容許您重定向或收集整組命令的輸出，如如下示例所示：

清單 11. 好習慣 6 的示例：在 Subshell 中運行命令列表

~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \
> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \
> | mailx admin -S "Archive contents"

在此示例中，該存檔的內容將提取到 tmp/a/b/c/ 目錄中，同時將分組命令的輸出（包括所提取文件的列表）經過郵件發送到地址 admin。

當您在命令列表中從新定義環境變量，而且您不但願將那些定義應用於當前 Shell 時，使用 Subshell 更可取。

在當前 Shell 中運行命令列表

將命令列表用大括號 ({}) 括起來，以在當前 Shell 中運行。確保在括號與實際命令之間包括空格，不然 Shell 可能沒法正確解釋括號。此外，還要確保列表中的最後一個命令以分號結尾，如如下示例所示：

清單 12. 好習慣 6 的另外一個示例：在當前 Shell 中運行命令列表

~ $ { cp ${VAR}a . && chown -R guest.guest a && \
> tar cvf newarchive.tar a; } | mailx admin -S "New archive"

7.在 find 以外使用 xargs

使用 xargs 工具做爲篩選器，以充分利用從 find 命令挑選的輸出。find 運行一般提供與某些條件匹配的文件列表。此列表被傳遞到 xargs 上，後者而後使用該文件列表做爲參數來運行其餘某些有用的命令，如如下示例所示：

清單 13. `xargs` 工具的經典用法示例

~ $ find some-file-criteria some-file-path | \
> xargs some-great-command-that-needs-filename-arguments

然而，不要將 xargs 僅看做是 find 的輔助工具；它是一個未獲得充分利用的工具之一，當您養成使用它的習慣時，將會但願進行全部試驗，包括如下用法。

傳遞空格分隔的列表

在最簡單的調用形式中，xargs 就像一個篩選器，它接受一個列表（每一個成員分別在單獨的行上）做爲輸入。該工具將那些成員放置在單個空格分隔的行上：

清單 14. `xargs` 工具產生的輸出示例

~ $ xargsabcControl-D
a b c
~ $

您能夠發送經過 xargs 來輸出文件名的任何工具的輸出，以便爲其餘某些接受文件名做爲參數的工具得到參數列表，如如下示例所示：

清單 15. `xargs` 工具的使用示例

~/tmp $ ls -1 | xargs
December_Report.pdf README a archive.tar mkdirhier.sh
~/tmp $ ls -1 | xargs file
December_Report.pdf: PDF document, version 1.3
README: ASCII text
a: directory
archive.tar: POSIX tar archive
mkdirhier.sh: Bourne shell script text executable
~/tmp $

xargs 命令不僅用於傳遞文件名。您還能夠在須要將文本篩選到單個行中的任什麼時候候使用它：

清單 16. 好習慣 7 的示例：使用 `xargs` 工具來將文本篩選到單個行中

~/tmp $ ls -l | xargs
-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \
root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \
16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \
joe joe 3239 Sep 30 12:40 mkdirhier.sh
~/tmp $

謹慎使用 `xargs`

從技術上講，使用 xargs 不多遇到麻煩。缺省狀況下，文件結束字符串是下劃線 (_)；若是將該字符做爲單個輸入參數來發送，則它以後的全部內容將被忽略。爲了防止這種狀況發生，可使用 -e 標誌，它在不帶參數的狀況下徹底禁用結束字符串。

8.瞭解什麼時候 grep 應該執行計數——什麼時候應該繞過

避免經過管道將 grep 發送到 wc -l 來對輸出行數計數。grep 的 -c 選項提供了對與特定模式匹配的行的計數，而且通常要比經過管道發送到 wc 更快，如如下示例所示：

清單 17. 好習慣 8 的示例：使用和不使用 grep 的行計數

~ $ time grep and tmp/a/longfile.txt | wc -l
2811

real    0m0.097s
user    0m0.006s
sys     0m0.032s
~ $ time grep -c and tmp/a/longfile.txt
2811

real    0m0.013s
user    0m0.006s
sys     0m0.005s
~ $

除了速度因素外，-c 選項仍是執行計數的好方法。對於多個文件，帶 -c 選項的 grep 返回每一個文件的單獨計數，每行一個計數，而針對 wc 的管道則提供全部文件的組合總計數。

然而，無論是否考慮速度，此示例都代表了另外一個要避免地常見錯誤。這些計數方法僅提供包含匹配模式的行數——若是那就是您要查找的結果，這沒什麼問題。可是在行中具備某個特定模式的多個實例的狀況下，這些方法沒法爲您提供實際匹配實例數量 的真實計數。歸根結底，若要對實例計數，您仍是要使用 wc 來計數。首先，使用 -o 選項（若是您的版本支持它的話）來運行 grep 命令。此選項僅輸出匹配的模式，每行一個模式，而不輸出行自己。可是您不能將它與 -c 選項結合使用，所以要使用 wc -l 來對行計數，如如下示例所示：

清單 18. 好習慣 8 的示例：使用 grep 對模式實例計數

~ $ grep -o and tmp/a/longfile.txt | wc -l
3402
~ $

在此例中，調用 wc 要比第二次調用 grep 並插入一個虛擬模式（例如 grep -c）來對行進行匹配和計數稍快一點。

9.匹配輸出中的某些字段，而不僅是對行進行匹配

當您只但願匹配輸出行中特定字段 中的模式時，諸如 awk 等工具要優於 grep。

下面通過簡化的示例演示瞭如何僅列出 12 月修改過的文件。

清單 19. 壞習慣 9 的示例：使用 grep 來查找特定字段中的模式

~/tmp $ ls -l /tmp/a/b/c | grep Dec
-rw-r--r--  7 joe joe  12043 Jan 27 20:36 December_Report.pdf
-rw-r--r--  1 root root  238 Dec 03 08:19 README
-rw-r--r--  3 joe joe   5096 Dec 14 14:26 archive.tar
~/tmp $

在此示例中，grep 對行進行篩選，並輸出其修改日期和名稱中帶 Dec 的全部文件。所以，諸如 December_Report.pdf 等文件是匹配的，即便它自從一月份以來還未修改過。這可能不是您但願的結果。爲了匹配特定字段中的模式，最好使用 awk，其中的一個關係運算符對確切的字段進行匹配，如如下示例所示：

清單 20. 好習慣 9 的示例：使用 `awk` 來查找特定字段中的模式

~/tmp $ ls -l | awk '$6 == "Dec"'
-rw-r--r--  3 joe joe   5096 Dec 14 14:26 archive.tar
-rw-r--r--  1 root root  238 Dec 03 08:19 README
~/tmp $

有關如何使用 awk 的更多詳細信息，請參見參考資料。

10.中止對 cat 使用管道

grep 的一個常見的基本用法錯誤是經過管道將 cat 的輸出發送到 grep 以搜索單個文件的內容。這絕對是沒必要要的，純粹是浪費時間，由於諸如 grep 這樣的工具接受文件名做爲參數。您根本不須要在這種狀況下使用 cat，如如下示例所示：

清單 21. 好習慣和壞習慣 10 的示例：使用帶和不帶 `cat` 的 grep

~ $ time cat tmp/a/longfile.txt | grep and
2811

real    0m0.015s
user    0m0.003s
sys     0m0.013s
~ $ time grep and tmp/a/longfile.txt
2811

real    0m0.010s
user    0m0.006s
sys     0m0.004s
~ $

此錯誤存在於許多工具中。因爲大多數工具都接受使用連字符 (-) 的標準輸入做爲一個參數，所以即便使用 cat 來分散 stdin 中的多個文件，參數也一般是無效的。僅當您使用帶多個篩選選項之一的 cat 時，才真正有必要在管道前首先執行鏈接。