引言html
當您常用某個系統時,每每會陷入某種固定的使用模式。有時,您沒有養成以儘量最好的方式作事的習慣。有時,您的不良習慣甚至會致使出現混亂。糾正此類缺點的最佳方法之一,就是有意識地採用抵制這些壞習慣的好習慣。本文提出了 10 個值得采用的 UNIX 命令行習慣——幫助您克服許多常見使用怪癖,並在該過程當中提升命令行工做效率的好習慣。下面列出了這 10 個好習慣,以後對進行了更詳細的描述。shell
要採用的十個好習慣爲:工具
find
以外使用 xargs
。grep
應該執行計數——什麼時候應該繞過。cat
使用管道。清單 1 演示了最多見的 UNIX 壞習慣之一:一次定義一個目錄樹。測試
~ $ mkdir tmp ~ $ cd tmp ~/tmp $ mkdir a ~/tmp $ cd a ~/tmp/a $ mkdir b ~/tmp/a $ cd b ~/tmp/a/b/ $ mkdir c ~/tmp/a/b/ $ cd c ~/tmp/a/b/c $
使用 mkdir
的 -p
選項並在單個命令中建立全部父目錄及其子目錄要容易得多。可是即便對於知道此選項的管理員,他們在命令行上建立子目錄時也仍然束縛於逐步建立每級子目錄。花時間有意識地養成這個好習慣是值得的:命令行
~ $ mkdir -p tmp/a/b/c
您可使用此選項來建立整個複雜的目錄樹(在腳本中使用是很是理想的),而不僅是建立簡單的層次結構。例如:unix
~ $ mkdir -p project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
過去,單獨定義目錄的惟一藉口是您的 mkdir
實現不支持此選項,可是在大多數系統上再也不是這樣了。IBM、AIX®、mkdir
、GNU mkdir
和其餘遵照單一 UNIX 規範 (Single UNIX Specification) 的系統如今都具備此選項。code
對於仍然缺少該功能的少數系統,您可使用 mkdirhier
腳本(請參見參考資料),此腳本是執行相同功能的 mkdir
的包裝:htm
~ $ mkdirhier project/{lib/ext,bin,src,doc/{html,info,pdf},demo/stat/a}
另外一個不良的使用模式是將 .tar 存檔文件移動到某個目錄,由於該目錄剛好是您但願在其中提取 .tar 文件的目錄。其實您根本不須要這樣作。您能夠爲所欲爲地將任何 .tar 存檔文件解壓縮到任何目錄——這就是 -C
選項的用途。在解壓縮某個存檔文件時,使用 -C
選項來指定要在其中解壓縮該文件的目錄:three
-C
來解壓縮 .tar 存檔文件~ $ tar xvf -C tmp/a/b/c newarc.tar.gz
相對於將存檔文件移動到您但願在其中解壓縮它的位置,切換到該目錄,而後才解壓縮它,養成使用 -C
的習慣則更加可取——當存檔文件位於其餘某個位置時尤爲如此。ip
您可能已經知道,在大多數 Shell 中,您能夠在單個命令行上經過在命令之間放置一個分號 (;) 來組合命令。該分號是 Shell 控制操做符,雖然它對於在單個命令行上將離散的命令串聯起來頗有用,但它並不適用於全部狀況。例如,假設您使用分號來組合兩個命令,其中第二個命令的正確執行徹底依賴於第一個命令的成功完成。若是第一個命令未按您預期的那樣退出,第二個命令仍然會運行——結果會致使失敗。相反,應該使用更適當的控制操做符(本文將描述其中的部分操做符)。只要您的 Shell 支持它們,就值得養成使用它們的習慣。
使用 &&
控制操做符來組合兩個命令,以便僅當 第一個命令返回零退出狀態時才運行第二個命令。換句話說,若是第一個命令運行成功,則第二個命令將運行。若是第一個命令失敗,則第二個命令根本就不運行。例如:
~ $ cd tmp/a/b/c && tar xvf ~/archive.tar
在此例中,存檔的內容將提取到 ~/tmp/a/b/c 目錄中,除非該目錄不存在。若是該目錄不存在,則 tar
命令不會運行,所以不會提取任何內容。
相似地,||
控制操做符分隔兩個命令,而且僅當第一個命令返回非零退出狀態時才運行第二個命令。換句話說,若是第一個命令成功,則第二個命令不會運行。若是第一個命令失敗,則第二個命令纔會 運行。在測試某個給定目錄是否存在時,一般使用此操做符,若是該目錄不存在,則建立它:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c
您還能夠組合使用本部分中描述的控制操做符。每一個操做符都影響最後的命令運行:
~ $ cd tmp/a/b/c || mkdir -p tmp/a/b/c && tar xvf -C tmp/a/b/c ~/archive.tar
始終要謹慎使用 Shell 擴展和變量名稱。通常最好將變量調用包括在雙引號中,除非您有不這樣作的足夠理由。相似地,若是您直接在字母數字文本後面使用變量名稱,則還要確保將該變量名稱包括在方括號 ([]) 中,以使其與周圍的文本區分開來。不然,Shell 將把尾隨文本解釋爲變量名稱的一部分——而且極可能返回一個空值。清單 8 提供了變量的各類引用和非引用及其影響的示例。
~ $ ls tmp/ a b ~ $ VAR="tmp/*" ~ $ echo $VAR tmp/a tmp/b ~ $ echo "$VAR" tmp/* ~ $ echo $VARa ~ $ echo "$VARa" ~ $ echo "${VAR}a" tmp/*a ~ $ echo ${VAR}a tmp/a ~ $
您或許看到過使用反斜槓 (\) 來將較長的行延續到下一行的代碼示例,而且您知道大多數 Shell 都將您經過反斜槓聯接的後續行上鍵入的內容視爲單個長行。然而,您可能沒有在命令行中像一般那樣利用此功能。若是您的終端沒法正確處理多行迴繞,或者您的命令行比一般小(例如在提示符下有長路經的時候),反斜槓就特別有用。反斜槓對於瞭解鍵入的長輸入行的含義也很是有用,如如下示例所示:
~ $ cd tmp/a/b/c || \ > mkdir -p tmp/a/b/c && \ > tar xvf -C tmp/a/b/c ~/archive.tar
或者,也可使用如下配置:
~ $ cd tmp/a/b/c \ > || \ > mkdir -p tmp/a/b/c \ > && \ > tar xvf -C tmp/a/b/c ~/archive.tar
然而,當您將輸入行劃分到多行上時,Shell 始終將其視爲單個連續的行,由於它老是刪除全部反斜槓和額外的空格。
注意:在大多數 Shell 中,當您按向上箭頭鍵時,整個多行輸入將重繪到單個長輸入行上。
大多數 Shell 都具備在列表中對命令分組的方法,以便您能將它們的合計輸出向下傳遞到某個管道,或者將其任何部分或所有流重定向到相同的地方。您通常能夠經過在某個 Subshell 中運行一個命令列表或經過在當前 Shell 中運行一個命令列表來實現此目的。
使用括號將命令列表包括在單個組中。這樣作將在一個新的 Subshell 中運行命令,並容許您重定向或收集整組命令的輸出,如如下示例所示:
~ $ ( cd tmp/a/b/c/ || mkdir -p tmp/a/b/c && \ > VAR=$PWD; cd ~; tar xvf -C $VAR archive.tar ) \ > | mailx admin -S "Archive contents"
在此示例中,該存檔的內容將提取到 tmp/a/b/c/ 目錄中,同時將分組命令的輸出(包括所提取文件的列表)經過郵件發送到地址 admin
。
當您在命令列表中從新定義環境變量,而且您不但願將那些定義應用於當前 Shell 時,使用 Subshell 更可取。
將命令列表用大括號 ({}) 括起來,以在當前 Shell 中運行。確保在括號與實際命令之間包括空格,不然 Shell 可能沒法正確解釋括號。此外,還要確保列表中的最後一個命令以分號結尾,如如下示例所示:
~ $ { cp ${VAR}a . && chown -R guest.guest a && \ > tar cvf newarchive.tar a; } | mailx admin -S "New archive"
使用 xargs
工具做爲篩選器,以充分利用從 find
命令挑選的輸出。find
運行一般提供與某些條件匹配的文件列表。此列表被傳遞到 xargs
上,後者而後使用該文件列表做爲參數來運行其餘某些有用的命令,如如下示例所示:
xargs
工具的經典用法示例~ $ find some-file-criteria some-file-path | \ > xargs some-great-command-that-needs-filename-arguments
然而,不要將 xargs
僅看做是 find
的輔助工具;它是一個未獲得充分利用的工具之一,當您養成使用它的習慣時,將會但願進行全部試驗,包括如下用法。
在最簡單的調用形式中,xargs
就像一個篩選器,它接受一個列表(每一個成員分別在單獨的行上)做爲輸入。該工具將那些成員放置在單個空格分隔的行上:
xargs
工具產生的輸出示例~ $ xargsabcControl-D a b c ~ $
您能夠發送經過 xargs
來輸出文件名的任何工具的輸出,以便爲其餘某些接受文件名做爲參數的工具得到參數列表,如如下示例所示:
xargs
工具的使用示例~/tmp $ ls -1 | xargs December_Report.pdf README a archive.tar mkdirhier.sh ~/tmp $ ls -1 | xargs file December_Report.pdf: PDF document, version 1.3 README: ASCII text a: directory archive.tar: POSIX tar archive mkdirhier.sh: Bourne shell script text executable ~/tmp $
xargs
命令不僅用於傳遞文件名。您還能夠在須要將文本篩選到單個行中的任什麼時候候使用它:
xargs
工具來將文本篩選到單個行中~/tmp $ ls -l | xargs -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 \ root root 238 Dec 03 08:19 README drwxr-xr-x 38 joe joe 354082 Nov 02 \ 16:07 a -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rwxr-xr-x 1 \ joe joe 3239 Sep 30 12:40 mkdirhier.sh ~/tmp $
xargs
從技術上講,使用 xargs
不多遇到麻煩。缺省狀況下,文件結束字符串是下劃線 (_);若是將該字符做爲單個輸入參數來發送,則它以後的全部內容將被忽略。爲了防止這種狀況發生,可使用 -e
標誌,它在不帶參數的狀況下徹底禁用結束字符串。
避免經過管道將 grep
發送到 wc -l
來對輸出行數計數。grep
的 -c
選項提供了對與特定模式匹配的行的計數,而且通常要比經過管道發送到 wc
更快,如如下示例所示:
~ $ time grep and tmp/a/longfile.txt | wc -l 2811 real 0m0.097s user 0m0.006s sys 0m0.032s ~ $ time grep -c and tmp/a/longfile.txt 2811 real 0m0.013s user 0m0.006s sys 0m0.005s ~ $
除了速度因素外,-c
選項仍是執行計數的好方法。對於多個文件,帶 -c
選項的 grep
返回每一個文件的單獨計數,每行一個計數,而針對 wc
的管道則提供全部文件的組合總計數。
然而,無論是否考慮速度,此示例都代表了另外一個要避免地常見錯誤。這些計數方法僅提供包含匹配模式的行數——若是那就是您要查找的結果,這沒什麼問題。可是在行中具備某個特定模式的多個實例的狀況下,這些方法沒法爲您提供實際匹配實例數量 的真實計數。歸根結底,若要對實例計數,您仍是要使用 wc
來計數。首先,使用 -o
選項(若是您的版本支持它的話)來運行 grep
命令。此選項僅 輸出匹配的模式,每行一個模式,而不輸出行自己。可是您不能將它與 -c
選項結合使用,所以要使用 wc -l
來對行計數,如如下示例所示:
~ $ grep -o and tmp/a/longfile.txt | wc -l 3402 ~ $
在此例中,調用 wc
要比第二次調用 grep
並插入一個虛擬模式(例如 grep -c
)來對行進行匹配和計數稍快一點。
當您只但願匹配輸出行中特定字段 中的模式時,諸如 awk
等工具要優於 grep
。
下面通過簡化的示例演示瞭如何僅列出 12 月修改過的文件。
~/tmp $ ls -l /tmp/a/b/c | grep Dec -rw-r--r-- 7 joe joe 12043 Jan 27 20:36 December_Report.pdf -rw-r--r-- 1 root root 238 Dec 03 08:19 README -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar ~/tmp $
在此示例中,grep
對行進行篩選,並輸出其修改日期和名稱中帶 Dec
的全部文件。所以,諸如 December_Report.pdf 等文件是匹配的,即便它自從一月份以來還未修改過。這可能不是您但願的結果。爲了匹配特定字段中的模式,最好使用 awk
,其中的一個關係運算符對確切的字段進行匹配,如如下示例所示:
awk
來查找特定字段中的模式~/tmp $ ls -l | awk '$6 == "Dec"' -rw-r--r-- 3 joe joe 5096 Dec 14 14:26 archive.tar -rw-r--r-- 1 root root 238 Dec 03 08:19 README ~/tmp $
有關如何使用 awk
的更多詳細信息,請參見參考資料。
grep
的一個常見的基本用法錯誤是經過管道將 cat
的輸出發送到 grep
以搜索單個文件的內容。這絕對是沒必要要的,純粹是浪費時間,由於諸如 grep
這樣的工具接受文件名做爲參數。您根本不須要在這種狀況下使用 cat
,如如下示例所示:
cat
的 grep~ $ time cat tmp/a/longfile.txt | grep and 2811 real 0m0.015s user 0m0.003s sys 0m0.013s ~ $ time grep and tmp/a/longfile.txt 2811 real 0m0.010s user 0m0.006s sys 0m0.004s ~ $
此錯誤存在於許多工具中。因爲大多數工具都接受使用連字符 (-) 的標準輸入做爲一個參數,所以即便使用 cat
來分散 stdin
中的多個文件,參數也一般是無效的。僅當您使用帶多個篩選選項之一的 cat
時,才真正有必要在管道前首先執行鏈接。
最好檢查一下您的命令行習慣中的任何不良的使用模式。不良的使用模式會下降您的速度,而且一般會致使意外錯誤。本文介紹了 10 個新習慣,它們能夠幫助您擺脫許多最多見的使用錯誤。養成這些好習慣是增強您的 UNIX 命令行技能的積極步驟。
原文連接:
英文版: http://www.ibm.com/developerworks/aix/library/au-badunixhabits.html?S_CMP=cn-a-aix&S_TACT=105AGX52
中文版: http://www.ibm.com/developerworks/cn/aix/library/au-badunixhabits.html