引言html
當您常用某個系統時,每每會陷入某種固定的使用模式。有時,您沒有養成以儘量最好的方式作事的習慣。有時,您的不良習慣甚至會致使出現混亂。糾正此類缺點的最佳方法之一,就是有意識地採用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 UNIX 命令行習慣——幫助您克服許多常見使用怪癖,並在該過程當中提升命令行工做效率的好習慣。下面列出了這 10 個好習慣,以後對進行了更詳細的描述。shell
要採用的十個好習慣爲: 測試
find
以外使用 xargs
。 grep
應該執行計數——什麼時候應該繞過。 cat
使用管道。 在單個命令中建立目錄樹spa
清單 1 演示了最多見的 UNIX 壞習慣之一:一次定義一個目錄樹。操作系統
~ $ mkdir tmp~ $ cd tmp~/tmp $ mkdir a~/tmp $ cd a~/tmp/a $ mkdir b~/tmp/a $ cd b~/tmp/a/b/ $ mkdir c~/tmp/a/b/ $ cd c~/tmp/a/b/c $ |
使用 mkdir
的 -p
選項並在單個命令中建立全部父目錄及其子目錄要容易得多。可是即便對於知道此選項的管理員,他們在命令行上建立子目錄時也仍然束縛於逐步建立每級子目錄。花時間有意識地養成這個好習慣是值得的:命令行
~ $ mkdir -p tmp/a/b/c |
您可使用此選項來建立整個複雜的目錄樹(在腳本中使用是很是理想的),而不僅是建立簡單的層次結構。例如:設計
~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a} |
過去,單獨定義目錄的惟一藉口是您的 mkdir
實現不支持此選項,可是在大多數系統上再也不是這樣了。IBM、AIX®、mkdir
、GNU mkdir
和其餘遵照單一 UNIX 規範 (Single UNIX Specification) 的系統如今都具備此選項。unix
對於仍然缺少該功能的少數系統,您可使用 mkdirhier
腳本(請參見參考資料),此腳本是執行相同功能的 mkdir
的包裝:code
~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a} |
另外一個不良的使用模式是將 .tar 存檔文件移動到某個目錄,由於該目錄剛好是您但願在其中提取 .tar 文件的目錄。其實您根本不須要這樣作。您能夠爲所欲爲地將任何 .tar 存檔文件解壓縮到任何目錄——這就是 -C
選項的用途。在解壓縮某個存檔文件時,使用 -C
選項來指定要在其中解壓縮該文件的目錄:
~ $ tar xvf -C tmp/a/b/c newarc.tar.gz |
相對於將存檔文件移動到您但願在其中解壓縮它的位置,切換到該目錄,而後才解壓縮它,養成使用 -C
的習慣則更加可取——當存檔文件位於其餘某個位置時尤爲如此。
您可能已經知道,在大多數 Shell 中,您能夠在單個命令行上經過在命令之間放置一個分號 (;) 來組合命令。該分號是 Shell 控制操做符,雖然它對於在單個命令行上將離散的命令串聯起來頗有用,但它並不適用於全部狀況。例如,假設您使用分號來組合兩個命令,其中第二個命令的正確執行徹底依賴於第一個命令的成功完成。若是第一個命令未按您預期的那樣退出,第二個命令仍然會運行——結果會致使失敗。相反,應該使用更適當的控制操做符(本文將描述其中的部分操做符)。只要您的 Shell 支持它們,就值得養成使用它們的習慣。
使用 &&
控制操做符來組合兩個命令,以便僅當 第一個命令返回零退出狀態時才運行第二個命令。換句話說,若是第一個命令運行成功,則第二個命令將運行。若是第一個命令失敗,則第二個命令根本就不運行。例如:
~ $ cd tmp/a/b/c && tar xvf ~/archive.tar |
在此例中,存檔的內容將提取到 ~/tmp/a/b/c 目錄中,除非該目錄不存在。若是該目錄不存在,則 tar
命令不會運行,所以不會提取任何內容。
相似地,||
控制操做符分隔兩個命令,而且僅當第一個命令返回非零退出狀態時才運行第二個命令。換句話說,若是第一個命令成功,則第二個命令不會運行。若是第一個命令失敗,則第二個命令纔會 運行。在測試某個給定目錄是否存在時,一般使用此操做符,若是該目錄不存在,則建立它:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c |
您還能夠組合使用本部分中描述的控制操做符。每一個操做符都影響最後的命令運行:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar |
始終要謹慎使用 Shell 擴展和變量名稱。通常最好將變量調用包括在雙引號中,除非您有不這樣作的足夠理由。相似地,若是您直接在字母數字文本後面使用變量名稱,則還要確保將該變量名稱包括在方括號 ([]) 中,以使其與周圍的文本區分開來。不然,Shell 將把尾隨文本解釋爲變量名稱的一部分——而且極可能返回一個空值。清單 8 提供了變量的各類引用和非引用及其影響的示例。
~ $ ls tmp/a b~ $ VAR="tmp/*"~ $ echo $VARtmp/a tmp/b~ $ echo "$VAR"tmp/*~ $ echo $VARa~ $ echo "$VARa"~ $ echo "${VAR}a"tmp/*a~ $ echo ${VAR}atmp/a~ $ |
您或許看到過使用反斜槓 (\) 來將較長的行延續到下一行的代碼示例,而且您知道大多數 Shell 都將您經過反斜槓聯接的後續行上鍵入的內容視爲單個長行。然而,您可能沒有在命令行中像一般那樣利用此功能。若是您的終端沒法正確處理多行迴繞,或者您的命令行比一般小(例如在提示符下有長路經的時候),反斜槓就特別有用。反斜槓對於瞭解鍵入的長輸入行的含義也很是有用,如如下示例所示:
~ $ cd tmp/a/b/c || \> mkdir -p tmp/a/b/c && \> tar xvf -C tmp/a/b/c ~/archive.tar |
或者,也可使用如下配置:
~ $ cd tmp/a/b/c \> || \> mkdir -p tmp/a/b/c \> && \> tar xvf -C tmp/a/b/c ~/archive.tar |
然而,當您將輸入行劃分到多行上時,Shell 始終將其視爲單個連續的行,由於它老是刪除全部反斜槓和額外的空格。
注意:在大多數 Shell 中,當您按向上箭頭鍵時,整個多行輸入將重繪到單個長輸入行上。
大多數 Shell 都具備在列表中對命令分組的方法,以便您能將它們的合計輸出向下傳遞到某個管道,或者將其任何部分或所有流重定向到相同的地方。您通常能夠經過在某個 Subshell 中運行一個命令列表或經過在當前 Shell 中運行一個命令列表來實現此目的。
使用括號將命令列表包括在單個組中。這樣作將在一個新的 Subshell 中運行命令,並容許您重定向或收集整組命令的輸出,如如下示例所示:
~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \> VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \> | mailx admin -S "Archive contents" |
在此示例中,該存檔的內容將提取到 tmp/a/b/c/ 目錄中,同時將分組命令的輸出(包括所提取文件的列表)經過郵件發送到地址 admin
。
當您在命令列表中從新定義環境變量,而且您不但願將那些定義應用於當前 Shell 時,使用 Subshell 更可取。
將命令列表用大括號 ({}) 括起來,以在當前 Shell 中運行。確保在括號與實際命令之間包括空格,不然 Shell 可能沒法正確解釋括號。此外,還要確保列表中的最後一個命令以分號結尾,如如下示例所示:
~ $ { cp ${VAR}a . && chown -R guest.guest a && \> tar cvf newarchive.tar a; } | mailx admin -S "New archive" |
使用 xargs
工具做爲篩選器,以充分利用從 find
命令挑選的輸出。find
運行一般提供與某些條件匹配的文件列表。此列表被傳遞到 xargs
上,後者而後使用該文件列表做爲參數來運行其餘某些有用的命令,如如下示例所示:
~ $ find some-file-criteria some-file-path | \> xargs some-great-command-that-needs-filename-arguments |
然而,不要將 xargs
僅看做是 find
的輔助工具;它是一個未獲得充分利用的工具之一,當您養成使用它的習慣時,將會但願進行全部試驗,包括如下用法。
在最簡單的調用形式中,xargs
就像一個篩選器,它接受一個列表(每一個成員分別在單獨的行上)做爲輸入。該工具將那些成員放置在單個空格分隔的行上:
~ $ xargsabcControl-Da b c~ $ |
您能夠發送經過 xargs
來輸出文件名的任何工具的輸出,以便爲其餘某些接受文件名做爲參數的工具得到參數列表,如如下示例所示:
~/tmp $ ls -1 | xargsDecember_Report.pdf README a archive.tar mkdirhier.sh~/tmp $ ls -1 | xargs fileDecember_Report.pdf: PDF document, version 1.3README: ASCII texta: directoryarchive.tar: POSIX tar archivemkdirhier.sh: Bourne shell script text executable~/tmp $ |
xargs
命令不僅用於傳遞文件名。您還能夠在須要將文本篩選到單個行中的任什麼時候候使用它:
~/tmp $ ls -l | xargs-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \joe joe 3239 Sep 30 12:40 mkdirhier.sh~/tmp $ |
從技術上講,使用 xargs
不多遇到麻煩。缺省狀況下,文件結束字符串是下劃線 (_);若是將該字符做爲單個輸入參瞭解什麼時候 grep 應該執行計數——什麼時候應該繞過
避免經過管道將 grep
發送到 wc -l
來對輸出行數計數。grep
的 -c
選項提供了對與特定模式匹配的行的計數,而且通常要比經過管道發送到 wc
更快,如如下示例所示:
~ $ time grep and tmp/a/longfile.txt | wc -l2811real 0m0.097suser 0m0.006ssys 0m0.032s~ $ time grep -c and tmp/a/longfile.txt2811real 0m0.013suser 0m0.006ssys 0m0.005s~ $ |
除了速度因素外,-c
選項仍是執行計數的好方法。對於多個文件,帶 -c
選項的 grep
返回每一個文件的單獨計數,每行一個計數,而針對 wc
的管道則提供全部文件的組合總計數。
然而,無論是否考慮速度,此示例都代表了另外一個要避免地常見錯誤。這些計數方法僅提供包含匹配模式的行數——若是那就是您要查找的結果,這沒什麼問題。可是在行中具備某個特定模式的多個實例的狀況下,這些方法沒法爲您提供實際匹配實例數量 的真實計數。歸根結底,若要對實例計數,您仍是要使用 wc
來計數。首先,使用 -o
選項(若是您的版本支持它的話)來運行 grep
命令。此選項僅 輸出匹配的模式,每行一個模式,而不輸出行自己。可是您不能將它與 -c
選項結合使用,所以要使用 wc -l
來對行計數,如如下示例所示:
~ $ grep -o and tmp/a/longfile.txt | wc -l3402~ $ |
在此例中,調用 wc
要比第二次調用 grep
並插入一個虛擬模式(例如 grep -c
)來對行進行匹配和計數稍快一點。
當您只但願匹配輸出行中特定字段 中的模式時,諸如 awk
等工具要優於 grep
。
下面通過簡化的示例演示瞭如何僅列出 12 月修改過的文件。
~/tmp $ ls -l /tmp/a/b/c | grep Dec-rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf-rw-r--r-- 1 root root 238 Dec 03 08:19 README-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar~/tmp $ |
在此示例中,grep
對行進行篩選,並輸出其修改日期和名稱中帶 Dec
的全部文件。所以,諸如 December_Report.pdf 等文件是匹配的,即便它自從一月份以來還未修改過。這可能不是您但願的結果。爲了匹配特定字段中的模式,最好使用 awk
,其中的一個關係運算符對確切的字段進行匹配,如如下示例所示:
~/tmp $ ls -l | awk '$6 == "Dec"'-rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar-rw-r--r-- 1 root root 238 Dec 03 08:19 README~/tmp $ |
有關如何使用 awk
的更多詳細信息,請參見參考資料。
grep
的一個常見的基本用法錯誤是經過管道將 cat
的輸出發送到 grep
以搜索單個文件的內容。這絕對是沒必要要的,純粹是浪費時間,由於諸如 grep
這樣的工具接受文件名做爲參數。您根本不須要在這種狀況下使用 cat
,如如下示例所示:
~ $ time cat tmp/a/longfile.txt | grep and2811real 0m0.015suser 0m0.003ssys 0m0.013s~ $ time grep and tmp/a/longfile.txt2811real 0m0.010suser 0m0.006ssys 0m0.004s~ $ |
此錯誤存在於許多工具中。因爲大多數工具都接受使用連字符 (-) 的標準輸入做爲一個參數,所以即便使用 cat
來分散 stdin
中的多個文件,參數也一般是無效的。僅當您使用帶多個篩選選項之一的 cat
時,才真正有必要在管道前首先執行鏈接。
最好檢查一下您的命令行習慣中的任何不良的使用模式。不良的使用模式會下降您的速度,而且一般會致使意外錯誤。本文介紹了 10 個新習慣,它們能夠幫助您擺脫許多最多見的使用錯誤。養成這些好習慣是增強您的 UNIX 命令行技能的積極步驟。
|
Michael Stutz 是 The Linux Cookbook 一書的做者,他僅使用開放源碼軟件對該書進行了設計和排版。他的研究興趣包括數字出版和圖書的發展將來。他使用各類 UNIX 操做系統已有 20 多年。您能夠經過 stutz@dsl.org 與他聯繫。 |