shell十三問

1) 爲什麼叫作 shell ?
在介紹 shell 是甚幺東西以前,不妨讓咱們從新檢視使用者與計算機系統的關係:
圖(FIXME)
咱們知道計算機的運做不能離開硬件,但使用者卻沒法直接對硬件做驅動,
硬件的驅動只能透過一個稱爲"操做系統(Operating System)"的軟件來控管,
事實上,咱們天天所談的 linux ,嚴格來講只是一個操做系統,咱們稱之爲"核心(kernel)"。
然而,從使用者的角度來講,使用者也沒辦法直接操做 kernel ,
而是透過 kernel 的"外殼"程序,也就是所謂的 shell ,來與 kernel 溝通。
這也正是 kernel 跟 shell 的形像命名關係。如圖:
圖(FIXME)
從技術角度來講,shell 是一個使用者與系統的互動界面(interface),
主要是讓使用者透過命令行(command line)來使用系統以完成工做。
所以,shell 的最簡單的定義就是---命令解譯器(Command Interpreter):
* 將使用者的命令翻譯給核心處理,
* 同時,將核心處理結果翻譯給使用者。
每次當咱們完成系統登入(log in),咱們就取得一個互動模式的 shell ,也稱爲 login shell
或 primary shell。
若從行程(process)角度來講,咱們在 shell 所下達的命令,均是 shell 所產生的子行程。
這現像,咱們暫可稱之爲 fork 。
若是是執行腳本(shell script)的話,腳本中的命令則是由另一個非互動模式的子 shell
(sub shell)來執行的。
也就是 primary shell 產生 sub shell 的行程,sub shell 再產生 script 中全部命令的
行程。
(關於行程,咱們往後有機會再補充。)
這裏,咱們必須知道:kernel 與 shell 是不一樣的兩套軟件,並且都是能夠被替換的:
* 不一樣的操做系統使用不一樣的 kernel ,
* 而在同一個 kernel 之上,也可以使用不一樣的 shell 。
在 linux 的預設系統中,一般均可以找到好幾種不一樣的 shell ,且一般會被列於以下檔案
裏:
/etc/shells
不一樣的 shell 有着不一樣的功能,且也彼此各異、或說"大同小異"。
常見的 shell 主要分爲兩大主流:
sh:
burne shell (sh)
burne again shell (bash)
csh:
c shell (csh)
tc shell (tcsh)
korn shell (ksh)
(FIXME)
大部份的 Linux 系統的預設 shell 都是 bash ,其緣由大體以下兩點:
* 自由軟件
* 功能強大
bash 是 gnu project 最成功的產品之一,自推出以來深受廣大 Unix 用戶喜好,
且也逐漸成爲很多組織的系統標準。
2) shell prompt(PS1) 與 Carriage Return(CR) 的關係?
當你成功登陸進一個文字界面以後,大部份情形下,
你會在熒幕上看到一個不斷閃爍的方塊或底線(視不一樣版本而別),
咱們稱之爲*遊標*(coursor)。
遊標的做用就是告訴你接下來你從鍵盤輸入的按鍵所插入的位置,
且每輸如一鍵遊標便向右邊移動一個格子,若連續輸入太多的話,則自動接在下一行輸入。
假如你剛完成登陸還沒輸入任何按鍵以前,你所看到的遊標所在位置的同一行的左邊部份,
咱們稱之爲*提示符號*(prompt)。
提示符號的格式或因不一樣系統版本而各有不一樣,在 Linux 上,只需留意最接近遊標的一個
可見的提示符號,一般是以下二者之一:
$:給通常使用者賬號使用
#:給 root (管理員)賬號使用
事實上,shell prompt 的意思很簡單:
* 是 shell 告訴使用者:您如今能夠輸入命令行了。
咱們能夠說,使用者只有在獲得 shell prompt 才能打命令行,
而 cursor 是指示鍵盤在命令行所輸入的位置,使用者每輸入一個鍵,cursor 就日後移動
一格,
直到碰到命令行讀進 CR(Carriage Return,由 Enter 鍵產生)字符爲止。
CR 的意思也很簡單:
* 是使用者告訴 shell:老兄你能夠執行個人命令行了。
嚴格來講:
* 所謂的命令行,就是在 shell prompt 與 CR 字符之間所輸入的文字。
(思考:爲什麼咱們這裏堅持使用 CR 字符而不說 Enter 鍵呢?答案在後面的學習中揭曉。)
不一樣的命令可接受的命令行格式或有不一樣,通常狀況下,一個標準的命令行格式爲以下所列:
command-name options argument
若從技術細節來看,shell 會依據 IFS(Internal Field Seperator) 將 command line 所
輸入的文字給拆解爲"字段"(word)。
而後再針對特殊字符(meta)先做處理,最後再重組整行 command line 。
(注意:請務必理解上兩句話的意思,咱們往後的學習中會常回到這裏思考。)
其中的 IFS 是 shell 預設使用的字段分隔符,能夠由一個及多個以下按鍵組成:
* 空格鍵(White Space)
* 表格鍵(Tab)
* 回車鍵(Enter)
系統可接受的命令名稱(command-name)能夠從以下途徑得到:
* 明確路徑所指定的外部命令
* 命令別名(alias)
* 自定功能(function)
* shell 內建命令(built-in)
* $PATH 之下的外部命令
每個命令行均必需含用命令名稱,這是不能缺乏的。
3) 別人 echo、你也 echo ,是問 echo 知多少?
承接上一章所介紹的 command line ,這裏咱們用 echo 這個命令加以進一步說明。
溫習---標準的 command line 包含三個部件:
* command_name option argument
echo 是一個很是簡單、直接的 Linux 命令:
* 將 argument 送出至標準輸出(STDOUT),一般就是在監視器(monitor)上輸出。
(注:stdout 咱們往後有機會再解說,或可先參考以下討論:
http://www.chinaunix.net/forum/viewtopic.php?t=191375 )
爲了更好理解,不如先讓咱們先跑一下 echo 命令好了:
代碼:
$ echo
$
你會發現只有一個空白行,而後又回到 shell prompt 上了。
這是由於 echo 在預設上,在顯示完 argument 以後,還會送出一個換行符號(new-line
charactor)。
可是上面的 command 並沒任何的 argument ,那結果就只剩一個換行符號了...
若你要取消這個換行符號,可利用 echo 的 -n option :
代碼:
$ echo -n
$
不妨讓咱們回到 command line 的概念上來討論上例的 echo 命令好了:
* command line 只有 command_name(echo) 及 option(-n),並無任何 argument 。
要想看看 echo 的 argument ,那還不簡單﹗接下來,你可試試以下的輸入:
代碼:
$ echo first line
first line
$ echo -n first line
first line $
於上兩個 echo 命令中,你會發現 argument 的部份顯示在你的熒幕,而換行符號則視 -n
option 的有無而別。
很明顯的,第二個 echo 因爲換行符號被取消了,接下來的 shell prompt 就接在輸出結果同
一行了... ^_^
事實上,echo 除了 -n options 以外,經常使用選項還有:
-e :啓用反斜線控制字符的轉換(參考下表)
-E:關閉反斜線控制字符的轉換(預設如此)
-n :取消行末之換行符號(與 -e 選項下的 \c 字符贊成)
關於 echo 命令所支持的反斜線控制字符以下表:
\a:ALERT / BELL (從系統喇叭送出鈴聲)
\b:BACKSPACE ,也就是向左刪除鍵
\c:取消行末之換行符號
\E:ESCAPE,跳脫鍵
\f:FORMFEED,換頁字符
\n:NEWLINE,換行字符
\r:RETURN,回車鍵
\t:TAB,表格跳位鍵
\v:VERTICAL TAB,垂直表格跳位鍵
\n:ASCII 八進位編碼(以 x 開首爲十六進制)
\\:反斜線自己
(表格資料來自 O'Reilly 出版社之 Learning the Bash Shell, 2nd Ed.)
或許,咱們能夠透過實例來了解 echo 的選項及控制字符:
例一:
代碼:
$ echo -e "a\tb\tc\nd\te\tf"
a b c
d e f
上例運用 \t 來區隔 abc 還有 def ,及用 \n 將 def 換至下一行。
例二:
代碼:
$ echo -e "\141\011\142\011\143\012\144\011\145\011\146"
a b c
d e f
與例一的結果同樣,只是使用 ASCII 八進位編碼。
例三:
代碼:
$ echo -e "\x61\x09\x62\x09\x63\x0a\x64\x09\x65\x09\x66"
a b c
d e f
與例二差很少,只是此次換用 ASCII 十六進制編碼。
例四:
代碼:
$ echo -ne "a\tb\tc\nd\te\bf\a"
a b c
d f $
由於 e 字母后面是刪除鍵(\b),所以輸出結果就沒有 e 了。
在結束時聽到一聲鈴向,那是 \a 的傑做﹗
因爲同時使用了 -n 選項,所以 shell prompt 緊接在第二行以後。
若你不用 -n 的話,那你在 \a 後再加個 \c ,也是一樣的效果。
事實上,在往後的 shell 操做及 shell script 設計上,echo 命令是最常被使用的命令之一。
比方說,用 echo 來檢查變量值:
代碼:
$ A=B
$ echo $A
B
$ echo $?
0
(注:關於變量概念,咱們留到下兩章纔跟你們說明。)
好了,更多的關於 command line 的格式,以及 echo 命令的選項,
就請您自行多加練習、運用了...
4) " "(雙引號) 與 ' '(單引號)差在哪?
仍是回到咱們的 command line 來吧...
通過前面兩章的學習,應該很清楚當你在 shell prompt 後面敲打鍵盤、直到按下 Enter 的時
候,
你輸入的文字就是 command line 了,而後 shell 纔會以行程的方式執行你所交給它的命令。
可是,你又可知道:你在 command line 輸入的每個文字,對 shell 來講,是有類別之分
的呢?
簡單而言(我不敢說這是精確的定議,注一),command line 的每個 charactor ,分爲如
下兩種:
* literal:也就是普通純文字,對 shell 來講沒特殊功能。
* meta:對 shell 來講,具備特定功能的特殊保留字符。
(注一:關於 bash shell 在處理 command line 時的順序說明,
請參考 O'Reilly 出版社之 Learning the Bash Shell, 2nd Edition,第 177 - 180 頁的說
明,
尤爲是 178 頁的流程圖 Figure 7-1 ... )
Literal 沒甚麼好談的,凡舉 abcd、123456 這些"文字"都是 literal ... (easy?)
但 meta 卻常使咱們困惑..... (confused?)
事實上,前兩章咱們在 command line 中已碰到兩個機乎每次都會碰到的 meta :
* IFS:由 <space> 或 <tab> 或 <enter> 三者之一組成(咱們經常使用 space )。
* CR:由 <enter> 產生。
IFS 是用來拆解 command line 的每個詞(word)用的,由於 shell command line 是按
詞來處理的。
而 CR 則是用來結束 command line 用的,這也是爲什麼咱們敲 <enter> 命令就會跑的原
因。
除了 IFS 與 CR ,經常使用的 meta 還有:
= : 設定變量。
$ : 做變量或運算替換(請不要與 shell prompt 搞混了)。
> :重導向 stdout。
< :重導向 stdin。
|:命令管線。
& :重導向 file descriptor ,或將命令置於背境執行。
( ):將其內的命令置於 nested subshell 執行,或用於運算或命令替換。
{ }:將其內的命令置於 non-named function 中執行,或用在變量替換的界定範圍。
; :在前一個命令結束時,而忽略其返回值,繼續執行下一個命令。
&& :在前一個命令結束時,若返回值爲 true,繼續執行下一個命令。
|| :在前一個命令結束時,若返回值爲 false,繼續執行下一個命令。
!:執行 history 列表中的命令
....
假如咱們須要在 command line 中將這些保留字符的功能關閉的話,就須要 quoting 處理
了。
在 bash 中,經常使用的 quoting 有以下三種方法:
* hard quote:' ' (單引號),凡在 hard quote 中的全部 meta 均被關閉。
* soft quote: " " (雙引號),在 soft quoe 中大部份 meta 都會被關閉,但某些則保留(如
$ )。(注二)
* escape : \ (反斜線),只有緊接在 escape (跳脫字符)以後的單一 meta 才被關閉。
( 注二:在 soft quote 中被豁免的具體 meta 清單,我不徹底知道,
有待你們補充,或透過實做來發現及理解。 )
下面的例子將有助於咱們對 quoting 的瞭解:
代碼:
$ A=B C # 空格鍵未被關掉,做爲 IFS 處理。
$ C: command not found.
$ echo $A
$ A="B C" # 空格鍵已被關掉,僅做爲空格鍵處理。
$ echo $A
B C
在第一次設定 A 變量時,因爲空格鍵沒被關閉,command line 將被解讀爲:
* A=B 而後碰到<IFS>,再執行 C 命令
在第二次設定 A 變量時,因爲空格鍵被置於 soft quote 中,所以被關閉,再也不做爲 IFS :
* A=B<space>C
事實上,空格鍵不管在 soft quote 仍是在 hard quote 中,均會被關閉。Enter 鍵亦然:
代碼:
$ A='B
> C
> '
$ echo "$A"
B
C
在上例中,因爲 <enter> 被置於 hard quote 當中,所以再也不做爲 CR 字符來處理。
這裏的 <enter> 單純只是一個斷行符號(new-line)而已,因爲 command line 並沒獲得
CR 字符,
所以進入第二個 shell prompt (PS2,以 > 符號表示),command line 並不會結束,
直到第三行,咱們輸入的 <enter> 並不在 hard quote 裏面,所以並沒被關閉,
此時,command line 碰到 CR 字符,因而結束、交給 shell 來處理。
上例的 <enter> 要是被置於 soft quote 中的話, CR 也會一樣被關閉:
代碼:
$ A="B
> C
> "
$ echo $A
B C
然而,因爲 echo $A 時的變量沒至於 soft quote 中,所以當變量替換完成後並做命令行重
組時,<enter> 會被解釋爲 IFS ,而不是解釋爲 New Line 字符。
一樣的,用 escape 亦可關閉 CR 字符:
代碼:
$ A=B\
> C\
>
$ echo $A
BC
上例中,第一個 <enter> 跟第二個 <enter> 均被 escape 字符關閉了,所以也不做爲 CR
來處理,
但第三個 <enter> 因爲沒被跳脫,所以做爲 CR 結束 command line 。
但因爲 <enter> 鍵自己在 shell meta 中的特殊性,在 \ 跳脫後面,僅僅取消其 CR 功能,
而不會保留其 IFS 功能。
您或許發現光是一個 <enter> 鍵所產生的字符就有多是以下這些可能:
CR
IFS
NL(New Line)
FF(Form Feed)
NULL
...
至於甚麼時候會解釋爲甚麼字符,這個我就沒去深挖了,或是留給讀者諸君自行慢慢摸索了...
^_^
至於 soft quote 跟 hard quote 的不一樣,主要是對於某些 meta 的關閉與否,以 $ 來做說
明:
代碼:
$ A=B\ C
$ echo "$A"
B C
$ echo '$A'
$A
在第一個 echo 命令行中,$ 被置於 soft quote 中,將不被關閉,所以繼續處理變量替換,
所以 echo 將 A 的變量值輸出到熒幕,也就獲得 "B C" 的結果。
在第二個 echo 命令行中,$ 被置於 hard quote 中,則被關閉,所以 $ 只是一個 $ 符號,
並不會用來做變量替換處理,所以結果是 $ 符號後面接一個 A 字母:$A 。
--------------------------------------
練習與思考:以下結果爲什麼不一樣?
代碼:
$ A=B\ C
$ echo '"$A"' # 最外面的是單引號
"$A"
$ echo "'$A'" # 最外面的是雙引號
'B C'
(提示:單引號及雙引號,在 quoting 中均被關?#93;了。)
--------------------------------------
在 CU 的 shell 版裏,我發現有不少初學者的問題,都與 quoting 理解的有關。
比方說,若咱們在 awk 或 sed 的命令參數中調用以前設定的一些變量時,常會問及爲什麼不能
的問題。
要解決這些問題,關鍵點就是:
* 區分出 shell meta 與 command meta
前面咱們提到的那些 meta ,都是在 command line 中有特殊用途的,
比方說 { } 是將其內一系列 command line 置於不具名的函式中執行(可簡單視爲
command block ),
可是,awk 卻須要用 { } 來區分出 awk 的命令區段(BEGIN, MAIN, END)。
若你在 command line 中如此輸入:
代碼:
$ awk {print $0} 1.txt
因爲 { } 在 shell 中並沒關閉,那 shell 就將 {print $0} 視爲 command block ,
但同時又沒有" ; "符號做命令區隔,所以就出現 awk 的語法錯誤結果。
要解決之,可用 hard quote :
代碼:
$ awk '{print $0}' 1.txt
上面的 hard quote 應好理解,就是將本來的 {、<space>、$(注三)、} 這幾個 shell meta
關閉,
避免掉在 shell 中遭處處理,而完整的成爲 awk 參數中的 command meta 。
( 注三:而其中的 $0 是 awk 內建的 field number ,而非 awk 的變量,
awk 自身的變量無需使用 $ 。)
要是理解了 hard quote 的功能,再來理解 soft quote 與 escape 就不難:
代碼:
awk "{print \$0}" 1.txt
awk \{print\ \$0\} 1.txt
然而,若你要改變 awk 的 $0 的 0 值是從另外一個 shell 變量讀進呢?
比方說:已有變量 $A 的值是 0 ,那如何在 command line 中解決 awk 的 $$A 呢?
你能夠很直接否認掉 hard quoe 的方案:
代碼:
$ awk '{print $$A}' 1.txt
那是由於 $A 的 $ 在 hard quote 中是不能替換變量的。
聰明的讀者(如你!),通過本章學習,我想,應該能夠解釋爲什麼咱們能夠使用以下操做了吧:
代碼:
A=0
awk "{print \$$A}" 1.txt
awk \{print\ \$$A\} 1.txt
awk '{print $'$A'}' 1.txt
awk '{print $'"$A"'}' 1.txt # 注:"$A" 包在 soft quote 中
或許,你能舉出更多的方案呢.... ^_^
--------------------------------------
練習與思考:請運用本章學到的知識分析以下兩串討論:
http://bbs.chinaunix.net/forum/viewtopic.php?t=207178
http://bbs.chinaunix.net/forum/viewtopic.php?t=216729
5) var=value?export 先後差在哪?
此次讓咱們暫時丟開 command line ,先來了解一下 bash 變量(variable)吧...
所謂的變量,就是就是利用一個特定的"名稱"(name)來存取一段能夠變化的"值"(value)。
*設定(set)*
在 bash 中,你能夠用 "=" 來設定或從新定義變量的內容:
name=value
在設定變量的時侯,得遵照以下規則:
* 等號左右兩邊不能使用區隔符號(IFS),也應避免使用 shell 的保留字符(meta charactor)。
* 變量名稱不能使用 $ 符號。
* 變量名稱的第一個字母不能是數字(number)。
* 變量名稱長度不可超過 256 個字母。
* 變量名稱及變量值之大小寫是有區別的(case sensitive)。
以下是一些變量設定時常見的錯誤:
A= B :不能有 IFS
1A=B :不能以數字開頭
$A=B :名稱不能有 $
a=B :這跟 a=b 是不一樣的
以下則是能夠接受的設定:
A=" B" :IFS 被關閉了 (請參考前面的 quoting 章節)
A1=B :並不是以數字開頭
A=$B :$ 可用在變量值內
This_Is_A_Long_Name=b :可用 _ 鏈接較長的名稱或值,且大小寫有別。
*變量替換(substitution)*
Shell 之因此強大,其中的一個因素是它能夠在命令行中對變量做替換(substitution)處理。
在命令行中使用者能夠使用 $ 符號加上變量名稱(除了在用 = 號定義變量名稱以外),
將變量值給替換出來,而後再從新組建命令行。
比方:
代碼:
$ A=ls
$ B=la
$ C=/tmp
$ $A -$B $C
(注意:以上命令行的第一個 $ 是 shell prompt ,並不在命令行以內。)
必需強調的是,咱們所提的變量替換,只發生在 command line 上面。(是的,讓咱們再回到
command line 吧﹗)
仔細分析最後那行 command line ,不難發如今被執行以前(在輸入 CR 字符以前),
$ 符號會對每個變量做替換處理(將變量值替換出來再重組命令行),最後會得出以下命令行:
代碼:
ls -la /tmp
還記得第二章我請你們"務必理解"的那兩句嗎?若你忘了,那我這裏再重貼一遍:
引用:
若從技術細節來看,shell 會依據 IFS(Internal Field Seperator) 將 command line 所輸
入的文字給拆解爲"字段"(word)。
而後再針對特殊字符(meta)先做處理,最後再重組整行 command line 。
這裏的 $ 就是 command line 中最經典的 meta 之一了,就是做變量替換的﹗
在平常的 shell 操做中,咱們常會使用 echo 命令來查看特定變量的值,例如:
代碼:
$ echo $A -$B $C
咱們已學過, echo 命令只單純將其 argument 送至"標準輸出"(STDOUT,一般是咱們的熒
幕)。
因此上面的命令會在熒幕上獲得以下結果:
代碼:
ls -la /tmp
這是因爲 echo 命令在執行時,會先將 $A(ls)、$B(la)、跟 $C(/tmp) 給替換出來的結果。
利用 shell 對變量的替換處理能力,咱們在設定變量時就更爲靈活了:
A=B
B=$A
這樣,B 的變量值就可繼承 A 變量"當時"的變量值了。
不過,不要以"數學羅輯"來套用變量的設定,比方說:
A=B
B=C
這樣並不會讓 A 的變量值變成 C 。再如:
A=B
B=$A
A=C
一樣也不會讓 B 的值換成 C 。
上面是單純定義了兩個不一樣名稱的變量:A 與 B ,它們的值分別是 B 與 C 。
若變量被重複定義的話,則原有舊值將被新值所取代。(這不正是"可變的量"嗎? ^_^)
當咱們在設定變量的時侯,請記着這點:
* 用一個名稱儲存一個數值
僅此而已。
此外,咱們也可利用命令行的變量替換能力來"擴充"(append)變量值:
A=B:C:D
A=$A:E
這樣,第一行咱們設定 A 的值爲 "B:C:D",而後,第二行再將值擴充爲 "A:B:C:E" 。
上面的擴充範例,咱們使用區隔符號( : )來達到擴充目的,
要是沒有區隔符號的話,以下是有問題的:
A=BCD
A=$AE
由於第二次是將 A 的值繼承 $AE 的提換結果,而非 $A 再加 E ﹗
要解決此問題,咱們可用更嚴謹的替換處理:
A=BCD
A=${A}E
上例中,咱們使用 {} 將變量名稱的範圍給明肯定義出來,
如此一來,咱們就能夠將 A 的變量值從 BCD 給擴充爲 BCDE 。
(提示:關於 ${name} 事實上還可作到更多的變量處理能力,這些均屬於比較進階的變量處
理,
現階段暫時不介紹了,請你們自行參考資料。如 CU 的貼子:
http://www.chinaunix.net/forum/viewtopic.php?t=201843
)
* export *
嚴格來講,咱們在當前 shell 中所定義的變量,均屬於"本地變量"(local variable),
只有通過 export 命令的"輸出"處理,才能成爲環境變量(environment variable):
代碼:
$ A=B
$ export A
或:
代碼:
$ export A=B
通過 export 輸出處理以後,變量 A 就能成爲一個環境變量供其後的命令使用。
在使用 export 的時侯,請別忘記 shell 在命令行對變量的"替換"(substitution)處理,
比方說:
代碼:
$ A=B
$ B=C
$ export $A
上面的命令並未將 A 輸出爲環境變量,而是將 B 做輸出,
這是由於在這個命令行中,$A 會首先被提換出 B 而後再"塞回"做 export 的參數。
要理解這個 export ,事實上須要從 process 的角度來理解才能透徹。
我將於下一章爲你們說明 process 的觀念,敬請留意。
*取消變量*
要取消一個變量,在 bash 中可以使用 unset 命令來處理:
代碼:
unset A
與 export 同樣,unset 命令行也一樣會做變量替換(這其實就是 shell 的功能之一),
所以:
代碼:
$ A=B
$ B=C
$ unset $A
事實上所取消的變量是 B 而不是 A 。
此外,變量一旦通過 unset 取消以後,其結果是將整個變量拿掉,而不只是取消其變量值。
以下兩行實際上是很不同的:
代碼:
$ A=
$ unset A
第一行只是將變量 A 設定爲"空值"(null value),但第二行則讓變量 A 不在存在。
雖然用眼睛來看,這兩種變量狀態在以下命令結果中都是同樣的:
代碼:
$ A=
$ echo $A
$ unset A
$ echo $A
請學員務必能識別 null value 與 unset 的本質區別,這在一些進階的變量處理上是很嚴格的。
比方說:
代碼:
$ str= # 設爲 null
$ var=${str=expr} # 定義 var
$ echo $var
$ echo $str
$ unset str # 取消
$ var=${str=expr} # 定義 var
$ echo $var
expr
$ echo $str
expr
聰明的讀者(yes, you!),稍加思考的話,
應該不難發現爲什麼一樣的 var=${str=expr} 在 null 與 unset 之下的不一樣吧?
若你看不出來,那多是以下緣由之一:
a. 你太笨了
b. 不瞭解 var=${str=expr} 這個進階處理
c. 對本篇說明還沒來得及消化吸取
e. 我講得很差
不知,你選哪一個呢?.... ^_^
6) exec 跟 source 差在哪?
此次先讓咱們從 CU Shell 版的一個實例貼子來談起吧:
( http://www.chinaunix.net/forum/viewtopic.php?t=194191 )
例中的提問是:
引用:
cd /etc/aa/bb/cc 能夠執行
可是把這條命令寫入 shell 時 shell 不執行!
這是什幺緣由呀!
我當時如何回答暫時別去深究,先讓咱們瞭解一下行程(process)的觀念好了。
首先,咱們所執行的任何程序,都是由父行程(parent process)所產生出來的一個子行程(child
process),
子行程在結束後,將返回到父行程去。此一現像在 Linux 系統中被稱爲 fork 。
(爲什麼要程爲 fork 呢?嗯,畫一下圖或許比較好理解... ^_^ )
當子行程被產生的時候,將會從父行程那裏得到必定的資源分配、及(更重要的是)繼承父行程的
環境﹗
讓咱們回到上一章所談到的"環境變量"吧:
* 所謂環境變量其實就是那些會傳給子行程的變量。
簡單而言,"遺傳性"就是區分本地變量與環境變量的決定性指針。
然而,從遺傳的角度來看,咱們也不難發現環境變量的另外一個重要特徵:
* 環境變量只能從父行程到子行程單向繼承。換句話說:在子行程中的環境如何變動,均不會
影響父行程的環境。
接下來,再讓咱們瞭解一下命令腳本(shell script)的概念。
所謂的 shell script 講起來很簡單,就是將你平時在 shell prompt 後所輸入的多行
command line 依序寫入一個文件去而已。
其中再加上一些條件判斷、互動界面、參數運用、函數調用、等等技巧,得以讓 script 更加"
聰明"的執行,
但若撇開這些技巧不談,咱們真的能夠簡單的當作 script 只不過依次執行預先寫好的命令行而
已。
再結合以上兩個概念(process + script),那應該就不難理解以下這句話的意思了:
* 正常來講,當咱們執行一個 shell script 時,實際上是先產生一個 sub-shell 的子行程,然
後 sub-shell 再去產生命令行的子行程。
然則,那讓咱們回到本章開始時所提到的例子再重新思考:
引用:
cd /etc/aa/bb/cc 能夠執行
可是把這條命令寫入 shell 時 shell 不執行!
這是什幺緣由呀!
我當時的答案是這樣的:
引用:
由於,通常咱們跑的 shell script 是用 subshell 去執行的。
從 process 的觀念來看,是 parent process 產生一個 child process 去執行,
當 child 結束後,會返回 parent ,但 parent 的環境是不會因 child 的改變而改變的。
所謂的環境元數不少,凡舉 effective id, variable, workding dir 等等...
其中的 workding dir ($PWD) 正是樓主的疑問所在:
當用 subshell 來跑 script 的話,sub shell 的 $PWD 會由於 cd 而變動,
但當返回 primary shell 時,$PWD 是不會變動的。
可以瞭解問題的緣由及其原理是很好的,可是?如何解決問題恐怕是咱們更感興趣的﹗是吧?
^_^
那好,接下來,再讓咱們瞭解一下 source 命令好了。
當你有了 fork 的概念以後,要理解 source 就不難:
* 所謂 source 就是讓 script 在當前 shell 內執行、而不是產生一個 sub-shell 來執行。
因爲全部執行結果均於當前 shell 內完成,若 script 的環境有所改變,固然也會改變當前環
境了﹗
所以,只要咱們要將本來單獨輸入的 script 命令行變成 source 命令的參數,就可輕易解決
前例提到的問題了。
比方說,本來咱們是如此執行 script 的:
代碼:
./my.script
如今改爲這樣便可:
代碼:
source ./my.script
或:
. ./my.script
說到這裏,我想,各位有興趣看看 /etc 底下的衆多設定文件,
應該不難理解它們被定議後,如何讓其它 script 讀取並繼承了吧?
若然,往後你有機會寫本身的 script ,應也不難專門指定一個設定文件以供不一樣的 script 一
起"共享"了... ^_^
okay,到這裏,若你搞得懂 fork 與 source 的不一樣,那接下來再接受一個挑戰:
---- 那 exec 又與 source/fork 有何不一樣呢?
哦... 要了解 exec 或許較爲複雜,尤爲扯上 File Descriptor 的話...
不過,簡單來講:
* exec 也是讓 script 在同一個行程上執行,可是原有行程則被結束了。
也就是簡而言之:原有行程會否終止,就是 exec 與 source/fork 的最大差別了。
嗯,光是從理論去理解,或許沒那麼好消化,不如動手"實做+思考"來的印像深入哦。
下面讓咱們寫兩個簡單的 script ,分別命令爲 1.sh 及 2.sh :
1.sh
代碼:
#!/bin/bash
A=B
echo "PID for 1.sh before exec/source/fork:$$"
export A
echo "1.sh: \$A is $A"
case $1 in
exec)
echo "using exec..."
exec ./2.sh ;;
source)
echo "using source..."
. ./2.sh ;;
*)
echo "using fork by default..."
./2.sh ;;
esac
echo "PID for 1.sh after exec/source/fork:$$"
echo "1.sh: \$A is $A"
2.sh
代碼:
#!/bin/bash
echo "PID for 2.sh: $$"
echo "2.sh get \$A=$A from 1.sh"
A=C
export A
echo "2.sh: \$A is $A"
而後,分別跑以下參數來觀察結果:
代碼:
$ ./1.sh fork
$ ./1.sh source
$ ./1.sh exec
或是,你也能夠參考 CU 上的另外一貼子:
http://www.chinaunix.net/forum/viewtopic.php?t=191051
好了,別忘了仔細比較輸出結果的不一樣及背後的緣由哦...
如有疑問,歡迎提出來一塊兒討論討論~~~
happy scripting! ^_^
7) ( ) 與 { } 差在哪?
嗯,此次輕鬆一下,不講太多... ^_^
先說一下,爲什麼要用 ( ) 或 { } 好了。
許多時候,咱們在 shell 操做上,須要在必定條件下一次執行多個命令,
也就是說,要麼不執行,要麼就全執行,而不是每次依序的判斷是否要執行下一個命令。
或是,須要從一些命令執行優先次順中獲得豁免,如算術的 2*(3+4) 那樣...
這時候,咱們就可引入"命令羣組"(command group)的概念:將多個命令集中處理。
在 shell command line 中,通常人或許不太計較 ( ) 與 { } 這兩對符號的差別,
雖然二者均可將多個命令做羣組化處理,但若從技術細節上,倒是很不同的:
( ) 將 command group 置於 sub-shell 去執行,也稱 nested sub-shell。
{ } 則是在同一個 shell 內完成,也稱爲 non-named command group。
若,你對上一章的 fork 與 source 的概念還記得了的話,那就不難理解二者的差別了。
要是在 command group 中扯上變量及其它環境的修改,咱們能夠根據不一樣的需求來使用 ( )
或 { } 。
一般而言,若所做的修改是臨時的,且不想影響原有或之後的設定,那咱們就 nested
sub-shell ,
反之,則用 non-named command group 。
是的,光從 command line 來看,( ) 與 { } 的差異就講完了,夠輕鬆吧~~~ ^_^
然而,若這兩個 meta 用在其它 command meta 或領域中(如 Regular Expression),還
是有不少差異的。
只是,我不打算再去說明了,留給讀者本身慢慢發掘好了...
我這裏只想補充一個概念,就是 function 。
所謂的 function ,就是用一個名字去命名一個 command group ,而後再調用這個名字去
執行 command group 。
從 non-named command group 來推斷,大概你也能夠猜到我要說的是 { } 了吧?(yes!
你真聰明﹗ ^_^ )
在 bash 中,function 的定義方式有兩種:
方式一:
代碼:
function function_name {
command1
command2
command3
....
}
方式二:
代碼:
fuction_name () {
command1
command2
command3
....
}
用哪種方式無所謂,只是若碰到所定意的名稱與現有的命令或別名(Alias)衝突的話,方式二
或許會失敗。
但方式二起碼能夠少打 function 這一串英文字母,對懶人來講(如我),又何樂不爲呢?...
^_^
function 在某一程度來講,也可稱爲"函式",但請不要與傳統編程所使用的函式(library)搞混
了,畢竟二者差別很大。
唯一相同的是,咱們均可以隨時用"已定義的名稱"來調用它們...
若咱們在 shell 操做中,須要不斷的重複質行某些命令,咱們首先想到的,或許是將命令寫成
命令稿(shell script)。
不過,咱們也能夠寫成 function ,而後在 command line 中打上 function_name 就可當
一舨的 script 來使用了。
只是若你在 shell 中定義的 function ,除了可用 unset function_name 取消外,一旦退出
shell ,function 也跟着取消。
然而,在 script 中使用 function 卻有許多好處,除了能夠提升總體 script 的執行效能外(因
爲已被加載),
還能夠節省許多重複的代碼...
簡單而言,若你會將多個命令寫成 script 以供調用的話,那,你能夠將 function 當作是
script 中的 script ... ^_^
並且,透過上一章介紹的 source 命令,咱們能夠自行定義許許多多好用的 function ,再集
中寫在特定文件中,
而後,在其它的 script 中用 source 將它們加載並反覆執行。
若你是 RedHat Linux 的使用者,或許,已經猜得出 /etc/rc.d/init.d/functions 這個文件
是做啥用的了~~~ ^_^
okay,說要輕鬆點的嘛,那此次就暫時寫到這吧。祝你們學習愉快﹗ ^_^
8) $(( )) 與 $( ) 還有${ } 差在哪?
咱們上一章介紹了 ( ) 與 { } 的不一樣,此次讓咱們擴展一下,看看更多的變化:$( ) 與 ${ }
又是啥玩意兒呢?
在 bash shell 中,$( ) 與 ` ` (反引號) 都是用來作命令替換用(command substitution)
的。
所謂的命令替換與咱們第五章學過的變量替換差很少,都是用來重組命令行:
* 完成引號裏的命令行,而後將其結果替換出來,再重組命令行。
例如:
代碼:
$ echo the last sunday is $(date -d "last sunday" +%Y-%m-%d)
如此即可方便獲得上一星期天的日期了... ^_^
在操做上,用 $( ) 或 ` ` 都無所謂,只是我"我的"比較喜歡用 $( ) ,理由是:
1, ` ` 很容易與 ' ' ( 單引號)搞混亂,尤爲對初學者來講。
有時在一些奇怪的字形顯示中,兩種符號是如出一轍的(直豎兩點)。
固然了,有經驗的朋友仍是一眼就能分辯二者。只是,若能更好的避免混亂,又何樂不爲呢?
^_^
2, 在多層次的複合替換中,` ` 需要額外的跳脫( \` )處理,而 $( ) 則比較直觀。例如:
這是錯的:
代碼:
command1 `command2 `command3` `
本來的意圖是要在 command2 `command3` 先將 command3 提換出來給 command
2 處理,
而後再將結果傳給 command1 `command2 ...` 來處理。
然而,真正的結果在命令行中倒是分紅了 `command2 ` 與 `` 兩段。
正確的輸入應該以下:
代碼:
command1 `command2 \`command3\` `
要否則,換成 $( ) 就沒問題了:
代碼:
command1 $(command2 $(command3))
只要你喜歡,作多少層的替換都沒問題啦~~~ ^_^
不過,$( ) 並非沒有斃端的...
首先,` ` 基本上可用在所有的 unix shell 中使用,若寫成 shell script ,其移植性比較高。
而 $( ) 並不見的每一種 shell 都能使用,我只能跟你說,若你用 bash2 的話,確定沒問題...
^_^
接下來,再讓咱們看 ${ } 吧... 它其實就是用來做變量替換用的啦。
通常狀況下,$var 與 ${var} 並無啥不同。
可是用 ${ } 會比較精確的界定變量名稱的範圍,比方說:
代碼:
$ A=B
$ echo $AB
本來是打算先將 $A 的結果替換出來,而後再補一個 B 字母於其後,
但在命令行上,真正的結果倒是隻會提換變量名稱爲 AB 的值出來...
若使用 ${ } 就沒問題了:
代碼:
$ echo ${A}B
BB
不過,假如你只看到 ${ } 只能用來界定變量名稱的話,那你就實在過小看 bash 了﹗
有興趣的話,你可先參考一下 cu 本版的精華文章:
http://www.chinaunix.net/forum/viewtopic.php?t=201843
爲了完整起見,我這裏再用一些例子加以說明 ${ } 的一些特異功能:
假設咱們定義了一個變量爲:
file=/dir1/dir2/dir3/my.file.txt
咱們能夠用 ${ } 分別替換得到不一樣的值:
${file#*/}:拿掉第一條 / 及其左邊的字符串:dir1/dir2/dir3/my.file.txt
${file##*/}:拿掉最後一條 / 及其左邊的字符串:my.file.txt
${file#*.}:拿掉第一個 . 及其左邊的字符串:file.txt
${file##*.}:拿掉最後一個 . 及其左邊的字符串:txt
${file%/*}:拿掉最後條 / 及其右邊的字符串:/dir1/dir2/dir3
${file%%/*}:拿掉第一條 / 及其右邊的字符串:(空值)
${file%.*}:拿掉最後一個 . 及其右邊的字符串:/dir1/dir2/dir3/my.file
${file%%.*}:拿掉第一個 . 及其右邊的字符串:/dir1/dir2/dir3/my
記憶的方法爲:
# 是去掉左邊(在鑑盤上 # 在 $ 之左邊)
% 是去掉右邊(在鑑盤上 % 在 $ 之右邊)
單一符號是最小匹配﹔兩個符號是最大匹配。
${file:0:5}:提取最左邊的 5 個字節:/dir1
${file:5:5}:提取第 5 個字節右邊的連續 5 個字節:/dir2
咱們也能夠對變量值裏的字符串做替換:
${file/dir/path}:將第一個 dir 提換爲 path:/path1/dir2/dir3/my.file.txt
${file//dir/path}:將所有 dir 提換爲 path:/path1/path2/path3/my.file.txt
利用 ${ } 還可針對不一樣的變量狀態賦值(沒設定、空值、非空值):
${file-my.file.txt} :假如 $file 沒有設定,則使用 my.file.txt 做傳回值。(空值及非空值
時不做處理)
${file:-my.file.txt} :假如 $file 沒有設定或爲空值,則使用 my.file.txt 做傳回值。 (非空
值時不做處理)
${file+my.file.txt} : 不 管 $file 爲 何 值 , 均 使 用 my.file.txt 做 傳 回 值 。
${file:+my.file.txt} :若 $file 爲非空值,則使用 my.file.txt 做傳回值。 (沒設定及空值
時不做處理)
${file=my.file.txt} :若 $file 沒設定,則使用 my.file.txt 做傳回值,同時將 $file 賦值
爲 my.file.txt 。 (空值及非空值時不做處理)
${file:=my.file.txt} :若 $file 沒設定或爲空值,則使用 my.file.txt 做傳回值,同時將
$file 賦值爲 my.file.txt 。 (非空值時不做處理)
${file?my.file.txt} :若 $file 沒設定,則將 my.file.txt 輸出至 STDERR。 (空值及非空
值時不做處理)
${file:?my.file.txt} :若 $file 沒設定或爲空值,則將 my.file.txt 輸出至 STDERR。 (非
空值時不做處理)
還有哦,${#var} 可計算出變量值的長度:
${#file} 可獲得 27 ,由於 /dir1/dir2/dir3/my.file.txt 恰好是 27 個字節...
接下來,再爲你們介稍一下 bash 的組數(array)處理方法。
通常而言,A="a b c def" 這樣的變量只是將 $A 替換爲一個單一的字符串,
可是改成 A=(a b c def) ,則是將 $A 定義爲組數...
bash 的組數替換方法可參考以下方法:
${A[@]} 或 ${A[*]} 可獲得 a b c def (所有組數)
${A[0]} 可獲得 a (第一個組數),${A[1]} 則爲第二個組數...
${#A[@]} 或 ${#A[*]} 可獲得 4 (所有組數數量)
${#A[0]} 可獲得 1 (即第一個組數(a)的長度),${#A[3]} 可獲得 3 (第四個組數(def)的
長度)
A[3]=xyz 則是將第四個組數從新定義爲 xyz ...
諸如此類的....
可以善用 bash 的 $( ) 與 ${ } 可大大提升及簡化 shell 在變量上的處理能力哦~~~
^_^
好了,最後爲你們介紹 $(( )) 的用途吧:它是用來做整數運算的。
在 bash 中,$(( )) 的整數運算符號大體有這些:
+ - * / :分別爲 "加、減、乘、除"。
% :餘數運算
& | ^ !:分別爲 "AND、OR、XOR、NOT" 運算。
例:
代碼:
$ a=5; b=7; c=2
$ echo $(( a+b*c ))
19
$ echo $(( (a+b)/c ))
6
$ echo $(( (a*b)%c))
1
在 $(( )) 中的變量名稱,可於其前面加 $ 符號來替換,也能夠不用,如:
$(( $a + $b * $c)) 也可獲得 19 的結果
此外,$(( )) 還可做不一樣進位(如二進制、八進位、十六進制)做運算呢,只是,輸出結果皆爲
十進制而已:
echo $((16#2a)) 結果爲 42 (16 進位轉十進制)
以一個實用的例子來看看吧:
假如當前的 umask 是 022 ,那麼新建文件的權限即爲:
代碼:
$ umask 022
$ echo "obase=8;$(( 8#666 & (8#777 ^ 8#$(umask)) ))" | bc
644
事實上,單純用 (( )) 也可重定義變量值,或做 testing:
a=5; ((a++)) 可將 $a 重定義爲 6
a=5; ((a--)) 則爲 a=4
a=5; b=7; ((a < b)) 會獲得 0 (true) 的返回值。
常見的用於 (( )) 的測試符號有以下這些:
<:小於
>:大於
<=:小於或等於
>=:大於或等於
==:等於
!=:不等於
不過,使用 (( )) 做整數測試時,請不要跟 [ ] 的整數測試搞混亂了。(更多的測試我將於第十
章爲你們介紹)
怎樣?好玩吧.. ^_^ okay,此次暫時說這麼多...
上面的介紹,並無詳列每一種可用的狀態,更多的,就請讀者參考手冊文件囉...
9) $@ 與 $* 差在哪?
要說 $@ 與 $* 以前,需得先從 shell script 的 positional parameter 談起...
咱們都已經知道變量(variable)是如何定義及替換的,這個不用再多講了。
可是,咱們還須要知道有些變量是 shell 內定的,且其名稱是咱們不能隨意修改的,
其中就有 positional parameter 在內。
在 shell script 中,咱們可用 $0, $1, $2, $3 ... 這樣的變量分別提取命令行中的以下部份:
代碼:
script_name parameter1 parameter2 parameter3 ...
咱們很容易就能猜出 $0 就是表明 shell script 名稱(路徑)自己,而 $1 就是其後的第一個參
數,如此類推....
須得留意的是 IFS 的做用,也就是,若 IFS 被 quoting 處理後,那麼 positional parameter
也會改變。
以下例:
代碼:
my.sh p1 "p2 p3" p4
因爲在 p2 與 p3 之間的空格鍵被 soft quote 所關閉了,所以 my.sh 中的 $2 是 "p2 p3"
而 $3 則是 p4 ...
還記得前兩章咱們提到 fucntion 時,我不是說過它是 script 中的 script 嗎? ^_^
是的,function 同樣能夠讀取本身的(有別於 script 的) postitional parameter ,唯一例外
的是 $0 而已。
舉例而言:假設 my.sh 裏有一個 fucntion 叫 my_fun , 若在 script 中跑 my_fun fp1
fp2 fp3 ,
那麼,function 內的 $0 是 my.sh ,而 $1 則是 fp1 而非 p1 了...
不如寫個簡單的 my.sh script 看看吧:
代碼:
#!/bin/bash
my_fun() {
echo '$0 inside function is '$0
echo '$1 inside function is '$1
echo '$2 inside function is '$2
}
echo '$0 outside function is '$0
echo '$1 outside function is '$1
echo '$2 outside function is '$2
my_fun fp1 "fp2 fp3"
而後在 command line 中跑一下 script 就知道了:
代碼:
chmod +x my.sh
./my.sh p1 "p2 p3"
$0 outside function is ./my.sh
$1 outside function is p1
$2 outside function is p2 p3
$0 inside function is ./my.sh
$1 inside function is fp1
$2 inside function is fp2 fp3
然而,在使用 positional parameter 的時候,咱們要注意一些陷阱哦:
* $10 不是替換第 10 個參數,而是替換第一個參數($1)而後再補一個 0 於其後﹗
也就是,my.sh one two three four five six seven eigth nine ten 這樣的 command
line ,
my.sh 裏的 $10 不是 ten 而是 one0 哦... 當心當心﹗
要抓到 ten 的話,有兩種方法:
方法一是使用咱們上一章介紹的 ${ } ,也就是用 ${10} 便可。
方法二,就是 shift 了。
用通俗的說法來講,所謂的 shift 就是取消 positional parameter 中最左邊的參數( $0 不
受影響)。
其默認值爲 1 ,也就是 shift 或 shift 1 都是取消 $1 ,而本來的 $2 則變成 $一、$3 變
成 $2 ...
若 shift 3 則是取消前面三個參數,也就是本來的 $4 將變成 $1 ...
那,親愛的讀者,你說要 shift 掉多少個參數,纔可用 $1 取得 ${10} 呢? ^_^
okay,當咱們對 positional parameter 有了基本概念以後,那再讓咱們看看其它相關變量吧。
首先是 $# :它可抓出 positional parameter 的數量。
之前面的 my.sh p1 "p2 p3" 爲例:
因爲 p2 與 p3 之間的 IFS 是在 soft quote 中,所以 $# 可獲得 2 的值。
但若是 p2 與 p3 沒有置於 quoting 中話,那 $# 就可獲得 3 的值了。
一樣的道理在 function 中也是同樣的...
所以,咱們常在 shell script 裏用以下方法測試 script 是否有讀進參數:
代碼:
[ $# = 0 ]
假如爲 0 ,那就表示 script 沒有參數,不然就是有帶參數...
接下來就是 $@ 與 $* :
精確來說,二者只有在 soft quote 中才有差別,不然,都表示"所有參數"( $0 除外)。
舉例來講好了:
若在 command line 上跑 my.sh p1 "p2 p3" p4 的話,
無論是 $@ 仍是 $* ,均可獲得 p1 p2 p3 p4 就是了。
可是,若是置於 soft quote 中的話:
"$@" 則可獲得 "p1" "p2 p3" "p4" 這三個不一樣的詞段(word)﹔
"$*" 則可獲得 "p1 p2 p3 p4" 這一整串單一的詞段。
咱們可修改一下前面的 my.sh ,使以內容以下:
代碼:
#!/bin/bash
my_fun() {
echo "$#"
}
echo 'the number of parameter in "$@" is '$(my_fun "$@")
echo 'the number of parameter in "$*" is '$(my_fun "$*")
而後再執行 ./my.sh p1 "p2 p3" p4 就知道 $@ 與 $* 差在哪了 ... ^_^
10) && 與 || 差在哪?
好不容易,進入兩位數的章節了... 一路走來,很辛苦吧?也很快樂吧? ^_^
在解答本章題目以前,先讓咱們瞭解一個概念:return value ﹗
咱們在 shell 下跑的每個 command 或 function ,在結束的時候都會傳回父行程一個值,
稱爲 return value 。
在 shell command line 中可用 $? 這個變量獲得最"新"的一個 return value ,也就是剛結
束的那個行程傳回的值。
Return Value(RV) 的取值爲 0-255 之間,由程序(或 script)的做者自行定議:
* 若在 script 裏,用 exit RV 來指定其值,若沒指定,在結束時以最後一道命令之 RV 爲值。
* 若在 function 裏,則用 return RV 來代替 exit RV 便可。
Return Value 的做用,是用來判斷行程的退出狀態(exit status),只有兩種:
* 0 的話爲"真"( true )
* 非 0 的話爲"假"( false )
舉個例子來講明好了:
假設當前目錄內有一份 my.file 的文件,而 no.file 是不存在的:
代碼:
$ touch my.file
$ ls my.file
$ echo $? # first echo
0
$ ls no.file
ls: no.file: No such file or directory
$ echo $? # second echo
1
$ echo $? # third echo
0
上例的第一個 echo 是關於 ls my.file 的 RV ,可獲得 0 的值,所以爲 true ﹔
第二個 echo 是關於 ls no.file 的 RV ,則獲得非 0 的值,所以爲 false ﹔
第三個 echo 是關於第二個 echo $? 的 RV ,爲 0 的值,所以也爲 true 。
請記住:每個 command 在結束時都會送回 return value 的﹗無論你跑甚麼樣的命令...
然而,有一個命令倒是"專門"用來測試某一條件而送出 return value 以供 true 或 false 的
判斷,
它就是 test 命令了﹗
若你用的是 bash ,請在 command line 下打 man test 或 man bash 來了解這個 test
的用法。
這是你可用做參考的最精確的文件了,要是聽別人說的,僅做參考就好...
下面我只簡單做一些輔助說明,其他的一概以 man 爲準:
首先,test 的表示式咱們稱爲 expression ,其命令格式有兩種:
代碼:
test expression
or:
[ expression ]
(請務必注意 [ ] 之間的空格鍵﹗)
用哪種格式沒所謂,都是同樣的效果。(我我的比較喜歡後者...)
其次,bash 的 test 目前支持的測試對像只有三種:
* string:字符串,也就是純文字。
* integer:整數( 0 或正整數,不含負數或小數點)。
* file:文件。
請初學者必定要搞清楚這三者的差別,由於 test 所用的 expression 是不同的。
以 A=123 這個變量爲例:
* [ "$A" = 123 ]:是字符串的測試,以測試 $A 是否爲 一、二、3 這三個連續的"文字"。
* [ "$A" -eq 123 ]:是整數的測試,以測試 $A 是否等於"一百二十三"。
* [ -e "$A" ]:是關於文件的測試,以測試 123 這份"文件"是否存在。
第三,當 expression 測試爲"真"時,test 就送回 0 (true) 的 return value ,不然送出非
0 (false)。
若在 expression 以前加上一個 " ! "(感嘆號),則是當 expression 爲"假時" 才送出 0 ,
不然送出非 0 。
同時,test 也容許多重的覆合測試:
* expression1 -a expression2 :當兩個 exrepssion 都爲 true ,才送出 0 ,不然送出
非 0 。
* expression1 -o expression2 :只需其中一個 exrepssion 爲 true ,就送出 0 ,只有
二者都爲 false 才送出非 0 。
例如:
代碼:
[ -d "$file" -a -x "$file" ]
是表示當 $file 是一個目錄、且同時具備 x 權限時,test 纔會爲 true 。
第四,在 command line 中使用 test 時,請別忘記命令行的"重組"特性,
也就是在碰到 meta 時會先處理 meta 再從新組建命令行。(這個特性我在第二及第四章都曾
反覆強調過)
比方說,若 test 碰到變量或命令替換時,若不能知足 expression 格式時,將會獲得語法錯
誤的結果。
舉例來講好了:
關於 [ string1 = string2 ] 這個 test 格式,
在 = 號兩邊必需要有字符串,其中包括空(null)字符串(可用 soft quote 或 hard quote 取
得)。
假如 $A 目前沒有定義,或被定議爲空字符串的話,那以下的寫法將會失敗:
代碼:
$ unset A
$ [ $A = abc ]
[: =: unary operator expected
這是由於命令行碰到 $ 這個 meta 時,會替換 $A 的值,而後再重組命令行,那就變成了:
[ = abc ]
如此一來 = 號左邊就沒有字符串存在了,所以形成 test 的語法錯誤﹗
可是,下面這個寫法則是成立的:
代碼:
$ [ "$A" = abc ]
$ echo $?
1
這是由於在命令行重組後的結果爲:
[ "" = abc ]
因爲 = 左邊咱們用 soft quote 獲得一個空字符串,而讓 test 語法得以經過...
讀者諸君請務必留意這些細節哦,由於稍一不慎,將會導至 test 的結果變了個樣﹗
若您對 test 還不是頗有經驗的話,那在使用 test 時不妨先採用以下這一個"法則":
* 假如在 test 中碰到變量替換,用 soft quote 是最保險的﹗
若你對 quoting 不熟的話,請從新溫習第四章的內容吧... ^_^
okay,關於更多的 test 用法,老話一句:請看 man page 吧﹗ ^_^
雖然洋洋灑灑講了一大堆,或許你還在嘀咕.... 那... 那個 return value 有啥用啊?﹗
問得好﹗
告訴你:return value 的做用可大了﹗若你想讓你的 shell 變"聰明"的話,就全靠它了:
* 有了 return value,咱們可讓 shell 跟據不一樣的狀態作不一樣的時情...
這時候,才讓我來揭曉本章的答案吧~~~ ^_^
&& 與 || 都是用來"組建"多個 command line 用的:
* command1 && command2 :其意思是 command2 只有在 RV 爲 0 (true) 的條件下
執行。
* command1 || command2 :其意思是 command2 只有在 RV 爲非 0 (false) 的條件
下執行。
來,以例子來講好了:
代碼:
$ A=123
$ [ -n "$A" ] && echo "yes! it's ture."
yes! it's ture.
$ unset A
$ [ -n "$A" ] && echo "yes! it's ture."
$ [ -n "$A" ] || echo "no, it's NOT ture."
no, it's NOT ture.
(注:[ -n string ] 是測試 string 長度大於 0 則爲 true 。)
上例的第一個 && 命令行之因此會執行其右邊的 echo 命令,是由於上一個 test 送回了 0
的 RV 值﹔
但第二次就不會執行,由於爲 test 送回非 0 的結果...
同理,|| 右邊的 echo 會被執行,卻正是由於左邊的 test 送回非 0 所引發的。
事實上,咱們在同一命令行中,可用多個 && 或 || 來組建呢:
代碼:
$ A=123
$ [ -n "$A" ] && echo "yes! it's ture." || echo "no, it's NOT ture."
yes! it's ture.
$ unset A
$ [ -n "$A" ] && echo "yes! it's ture." || echo "no, it's NOT ture."
no, it's NOT ture.
怎樣,從這一刻開始,你是否以爲咱們的 shell 是"很聰明"的呢? ^_^
好了,最後,佈置一道習題給你們作作看、、、
下面的判斷是:當 $A 被賦與值時,再看是否小於 100 ,不然送出 too big! :
代碼:
$ A=123
$ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!'
too big!
若我將 A 取消,照理說,應該不會送文字纔對啊(由於第一個條件就不成立了)...
代碼:
$ unset A
$ [ -n "$A" ] && [ "$A" -lt 100 ] || echo 'too big!'
too big!
爲什麼上面的結果也可獲得呢?
又,如何解決之呢?
(提示:修改方法不少,其中一種方法可利用第七章介紹過的 command group ...)
快﹗告我我答案﹗其他免談....
11) > 與 < 差在哪?
此次的題目以前我在 CU 的 shell 版已說明過了:
http://bbs.chinaunix.net/forum/24/20031030/191375.html
此次我就不重寫了,將貼子的內容"抄"下來就是了...
--------------
11.1
談到 I/O redirection ,不妨先讓咱們認識一下 File Descriptor (FD) 。
程序的運算,在大部份狀況下都是進行數據(data)的處理,
這些數據從哪讀進?又,送出到哪裏呢?
這就是 file descriptor (FD) 的功用了。
在 shell 程序中,最常使用的 FD 大概有三個,分別爲:
0: Standard Input (STDIN)
1: Standard Output (STDOUT)
2: Standard Error Output (STDERR)
在標準狀況下,這些 FD 分別跟以下設備(device)關聯:
stdin(0): keyboard
stdout(1): monitor
stderr(2): monitor
咱們能夠用以下下命令測試一下:
代碼:
$ mail -s test root
this is a test mail.
please skip.
^d (同時按 crtl 跟 d 鍵)
很明顯,mail 程序所讀進的數據,就是從 stdin 也就是 keyboard 讀進的。
不過,不見得每一個程序的 stdin 都跟 mail 同樣從 keyboard 讀進,
由於程序做者能夠從檔案參數讀進 stdin ,如:
代碼:
$ cat /etc/passwd
但,要是 cat 以後沒有檔案參數則又如何呢?
哦,請您本身玩玩看囉.... ^_^
代碼:
$ cat
(請留意數據輸出到哪裏去了,最後別忘了按 ^d 離開...)
至於 stdout 與 stderr ,嗯... 等我有空再續吧... ^_^
仍是,有哪位前輩要來玩接龍呢?
--------------
11.2
沿文再續,書接上一回... ^_^
相信,通過上一個練習後,你對 stdin 與 stdout 應該不難理解吧?
而後,讓咱們繼續看 stderr 好了。
事實上,stderr 沒甚麼難理解的:說穿了就是"錯誤信息"要往哪邊送而已...
比方說,若讀進的檔案參數是不存在的,那咱們在 monitor 上就看到了:
代碼:
$ ls no.such.file
ls: no.such.file: No such file or directory
若,一個命令同時產生 stdout 與 stderr 呢?
那還不簡單,都送到 monitor 來就行了:
代碼:
$ touch my.file
$ ls my.file no.such.file
ls: no.such.file: No such file or directory
my.file
okay,至此,關於 FD 及其名稱、還有相關聯的設備,相信你已經沒問題了吧?
那好,接下來讓咱們看看如何改變這些 FD 的預設數據信道,
咱們可用 < 來改變讀進的數據信道(stdin),使之從指定的檔案讀進。
咱們可用 > 來改變送出的數據信道(stdout, stderr),使之輸出到指定的檔案。
比方說:
代碼:
$ cat < my.file
就是從 my.file 讀進數據
代碼:
$ mail -s test root < /etc/passwd
則是從 /etc/passwd 讀進...
這樣一來,stdin 將再也不是從 keyboard 讀進,而是從檔案讀進了...
嚴格來講,< 符號以前須要指定一個 FD 的(之間不能有空白),
但由於 0 是 < 的默認值,所以 < 與 0< 是同樣的﹗
okay,這個好理解吧?
那,要是用兩個 << 又是啥呢?
這是所謂的 HERE Document ,它可讓咱們輸入一段文本,直到讀到 << 後指定的字符串。
比方說:
代碼:
$ cat <<FINISH
first line here
second line there
third line nowhere
FINISH
這樣的話,cat 會讀進 3 行句子,而無需從 keyboard 讀進數據且要等 ^d 結束輸入。
至於 > 又如何呢?
且聽下回分解....
--------------
11.3
okay,又到講古時間~~~
當你搞懂了 0< 原來就是改變 stdin 的數據輸入信道以後,相信要理解以下兩個 redirection
就不難了:
* 1>
* 2>
前者是改變 stdout 的數據輸出信道,後者是改變 stderr 的數據輸出信道。
二者都是將本來要送出到 monitor 的數據轉向輸出到指定檔案去。
因爲 1 是 > 的默認值,所以,1> 與 > 是相同的,都是改 stdout 。
用上次的 ls 例子來講明一下好了:
代碼:
$ ls my.file no.such.file 1>file.out
ls: no.such.file: No such file or directory
這樣 monitor 就只剩下 stderr 而已。由於 stdout 給寫進 file.out 去了。
代碼:
$ ls my.file no.such.file 2>file.err
my.file
這樣 monitor 就只剩下 stdout ,由於 stderr 寫進了 file.err 。
代碼:
$ ls my.file no.such.file 1>file.out 2>file.err
這樣 monitor 就啥也沒有,由於 stdout 與 stderr 都給轉到檔案去了...
呵~~~ 看來要理解 > 一點也不難啦﹗是不?沒騙你吧? ^_^
不過,有些地方仍是要注意一下的。
首先,是 file locking 的問題。比方以下這個例子:
代碼:
$ ls my.file no.such.file 1>file.both 2>file.both
從 file system 的角度來講,單一檔案在單一時間內,只能被單一的 FD 做寫入。
假如 stdout(1) 與 stderr(2) 都同時在寫入 file.both 的話,
則要看它們在寫入時否碰到同時競爭的情形了,基本上是"先搶先贏"的原則。
讓咱們用周星馳式的"慢鏡頭"來看一下 stdout 與 stderr 同時寫入 file.out 的情形好了:
* 第 1, 2, 3 秒爲 stdout 寫入
* 第 3, 4, 5 秒爲 stderr 寫入
那麼,這時候 stderr 的第 3 秒所寫的數據就丟失掉了﹗
要是咱們能控制 stderr 必須等 stdout 寫完再寫,或倒過來,stdout 等 stderr 寫完再寫,
那問題就能解決。
但從技術上,較難掌控的,尤爲是 FD 在做"長期性"的寫入時...
那,如何解決呢?所謂山不轉路轉、路不轉人轉嘛,
咱們能夠換一個思惟:將 stderr 導進 stdout 或將 stdout 導進 sterr ,而不是你們在搶同
一份檔案,不就好了﹗
bingo﹗就是這樣啦:
* 2>&1 就是將 stderr 並進 stdout 做輸出
* 1>&2 或 >&2 就是將 stdout 並進 stderr 做輸出
因而,前面的錯誤操做能夠改成:
代碼:
$ ls my.file no.such.file 1>file.both 2>&1

$ ls my.file no.such.file 2>file.both >&2
這樣,不就皆大歡喜了嗎? 呵~~~ ^_^
不過,光解決了 locking 的問題還不夠,咱們還有其它技巧須要瞭解的。
故事還沒結束,別走開﹗廣告後,咱們再回來...﹗
--------------
11.4
okay,此次不講 I/O Redirction ,講佛吧...
(有沒搞錯?﹗網中人是否頭殼燒壞了?...) 嘻~~~ ^_^
學佛的最高境界,就是"四大皆空"。至因而空哪四大塊?我也不知,由於我還沒到那境界...
但這個"空"字,卻很是值得咱們返復把玩的:
--- 色便是空、空便是色﹗
好了,施主要是可以領會"空"的禪意,那離修成正果不遠矣~~~
在 Linux 檔案系統裏,有個設備檔位於 /dev/null 。
許多人都問過我那是甚麼玩意兒?我跟你說好了:那就是"空"啦﹗
沒錯﹗空空如也的空就是 null 了.... 請問施主是否突然有所頓誤了呢?然則恭喜了~~~
^_^
這個 null 在 I/O Redirection 中可有用得很呢:
* 若將 FD1 跟 FD2 轉到 /dev/null 去,就可將 stdout 與 stderr 弄不見掉。
* 若將 FD0 接到 /dev/null 來,那就是讀進 nothing 。
比方說,當咱們在執行一個程序時,畫面會同時送出 stdout 跟 stderr ,
假如你不想看到 stderr (也不想存到檔案去),那能夠:
代碼:
$ ls my.file no.such.file 2>/dev/null
my.file
若要相反:只想看到 stderr 呢?還不簡單﹗將 stdout 弄到 null 就行:
代碼:
$ ls my.file no.such.file >/dev/null
ls: no.such.file: No such file or directory
那接下來,假如單純只跑程序,不想看到任何輸出結果呢?
哦,這裏留了一手上次節目沒講的法子,專門贈予有緣人﹗... ^_^
除了用 >/dev/null 2>&1 以外,你還能夠如此:
代碼:
$ ls my.file no.such.file &>/dev/null
(提示:將 &> 換成 >& 也行啦~~! )
okay?講完佛,接下來,再讓咱們看看以下狀況:
代碼:
$ echo "1" > file.out
$ cat file.out
1
$ echo "2" > file.out
$ cat file.out
2
看來,咱們在重導 stdout 或 stderr 進一份檔案時,彷佛永遠只得到最後一次導入的結果。
那,以前的內容呢?
呵~~~ 要解決這個問提很簡單啦,將 > 換成 >> 就好:
代碼:
$ echo "3" >> file.out
$ cat file.out
2
3
如此一來,被重導的目標檔案以內容並不會失去,而新的內容則一直增長在最後面去。
easy ? 呵 ... ^_^
但,只要你再一次用回單一的 > 來重導的話,那麼,舊的內容仍是會被"洗"掉的﹗
這時,你要如何避免呢?
----備份﹗ yes ,我聽到了﹗不過.... 還有更好的嗎?
既然與施主這麼有緣份,老納就送你一個錦囊妙法吧:
代碼:
$ set -o noclobber
$ echo "4" > file.out
-bash: file: cannot overwrite existing file
那,要如何取消這個"限制"呢?
哦,將 set -o 換成 set +o 就行:
代碼:
$ set +o noclobber
$ echo "5" > file.out
$ cat file.out
5
再問:那... 有辦法不取消而又"臨時"蓋寫目標檔案嗎?
哦,佛曰:不可告也﹗
啊~~~ 開玩笑的、開玩笑的啦~~~ ^_^ 唉,早就料到人心是不足的了﹗
代碼:
$ set -o noclobber
$ echo "6" >| file.out
$ cat file.out
6
留意到沒有:在 > 後面再加個" | "就好(注意: > 與 | 之間不能有空白哦)....
呼.... (深呼吸吐納一下吧)~~~ ^_^
再來還有一個難題要你去參透的呢:
代碼:
$ echo "some text here" > file
$ cat < file
some text here
$ cat < file > file.bak
$ cat < file.bak
some text here
$ cat < file > file
$ cat < file
嗯?﹗注意到沒有?﹗﹗
---- 怎麼最後那個 cat 命令看到的 file 竟是空的?﹗
why? why? why?
同窗們:下節課不要遲到囉~~~!
--------------
11.5
噹噹噹~~~ 上課囉~~~ ^_^
前面提到:$ cat < file > file 以後本來有內容的檔案結果卻被洗掉了﹗
要理解這一現像其實不難,這只是 priority 的問題而已:
* 在 IO Redirection 中,stdout 與 stderr 的管道會先準備好,纔會從 stdin 讀進資料。
也就是說,在上例中,> file 會先將 file 清空,而後纔讀進 < file ,
但這時候檔案已經被清空了,所以就變成讀不進任何資料了...
哦~~~ 原來如此~~~~ ^_^
那... 以下兩例又如何呢?
代碼:
$ cat <> file
$ cat < file >> file
嗯... 同窗們,這兩個答案就當練習題囉,下節課以前請交做業﹗
好了,I/O Redirection 也快講完了,sorry,由於我也只知道這麼多而已啦~~~ 嘻~~ ^_^
不過,還有同樣東東是必定要講的,各位觀衆(請自行配樂~!#@!$%) :
---- 就是 pipe line 也﹗
談到 pipe line ,我相信很多人都不會陌生:
咱們在不少 command line 上常看到的" | "符號就是 pipe line 了。
不過,究竟 pipe line 是甚麼東東呢?
別急別急... 先查一下英漢字典,看看 pipe 是甚麼意思?
沒錯﹗它就是"水管"的意思...
那麼,你能想象一下水管是怎麼一根接着一根的嗎?
又,每根水管之間的 input 跟 output 又如何呢?
嗯??
靈光一閃:原來 pipe line 的 I/O 跟水管的 I/O 是如出一轍的:
* 上一個命令的 stdout 接到下一個命令的 stdin 去了﹗
的確如此... 無論在 command line 上你使用了多少個 pipe line ,
先後兩個 command 的 I/O 都是彼此鏈接的﹗(恭喜:你終於開竅了﹗ ^_^ )
不過... 然而... 可是... ... stderr 呢?
好問題﹗不過也容易理解:
* 若水管漏水怎麼辦?
也就是說:在 pipe line 之間,前一個命令的 stderr 是不會接進下一命令的 stdin 的,
其輸出,若不用 2> 導到 file 去的話,它仍是送到監視器上面來﹗
這點請你在 pipe line 運用上務必要注意的。
那,或許你又會問:
* 有辦法將 stderr 也喂進下一個命令的 stdin 去嗎?
(貪得無厭的傢伙﹗)
方法固然是有,並且你早已學過了﹗ ^_^
我提示一下就好:
* 請問你如何將 stderr 合併進 stdout 一同輸出呢?
若你答不出來,下課以後再來問我吧... (若是你臉皮真夠厚的話...)
或許,你仍意尤未盡﹗或許,你曾經碰到過下面的問題:
* 在 cm1 | cm2 | cm3 ... 這段 pipe line 中,若要將 cm2 的結果存到某一檔案呢?
若你寫成 cm1 | cm2 > file | cm3 的話,
那你確定會發現 cm3 的 stdin 是空的﹗(固然啦,你都將水管接到別的水池了﹗)
聰明的你或許會如此解決:
代碼:
cm1 | cm2 > file ; cm3 < file
是的,你的確能夠這樣作,但最大的壞處是:這樣一來,file I/O 會變雙倍﹗
在 command 執行的整個過程當中,file I/O 是最多見的最大效能殺手。
凡有經驗的 shell 操做者,都會盡可能避免或下降 file I/O 的頻率。
那,上面問題還有更好方法嗎?
有的,那就是 tee 命令了。
* 所謂 tee 命令是在不影響本來 I/O 的狀況下,將 stdout 複製一份到檔案去。
所以,上面的命令行能夠如此打:
代碼:
cm1 | cm2 | tee file | cm3
在預設上,tee 會改寫目標檔案,若你要改成增長內容的話,那可用 -a 參數達成。
基本上,pipe line 的應用在 shell 操做上是很是普遍的,尤爲是在 text filtering 方面,
凡舉 cat, more, head, tail, wc, expand, tr, grep, sed, awk, ... 等等文字處理工具,
搭配起 pipe line 來使用,你會驚覺 command line 原來是活得如此精彩的﹗
常讓人有"衆裏尋他千百度,驀然回首,那人卻在燈火闌珊處﹗"之感... ^_^
12) 你要 if 仍是 case 呢?
放了一個愉快的春節假期,人也變得懶懶散散的... 只是,答應了你們的做業,仍是要堅持完成
就是了~~~
還記得咱們在第 10 章所介紹的 return value 嗎?
是的,接下來介紹的內容與之有關,若你的記憶也被假期的歡樂時光所抵消掉的話,
那,建議您仍是先回去溫習溫習再回來...
若你記得 return value ,我想你也應該記得了 && 與 || 是甚麼意思吧?
用這兩個符號再配搭 command group 的話,咱們可以讓 shell script 變得更加聰明哦。
比方說:
代碼:
comd1 && {
comd2
comd3
} || {
comd4
comd5
}
意思是說:
假如 comd1 的 return value 爲 true 的話,
然則執行 comd3 與 comd4 ,
不然執行 comd4 與 comd5 。
事實上,咱們在寫 shell script 的時候,常常須要用到這樣那樣的條件以做出不一樣的處理動做。
用 && 與 || 的確能夠達成條件執行的效果,然而,從"人類語言"上來理解,卻不是那麼直觀。
更多時候,咱們仍是喜歡用 if .... then ... else ... 這樣的 keyword 來表達條件執行。
在 bash shell 中,咱們能夠如此修改上一段代碼:
代碼:
if comd1
then
comd2
comd3
else
comd4
comd5
fi
這也是咱們在 shell script 中最經常使用到的 if 判斷式:
只要 if 後面的 command line 返回 true 的 return value (咱們最經常使用 test 命令
來送出 return value),
然則就執行 then 後面的命令,不然執行 else 後的命令﹔fi 則是用來結束判斷式的
keyword 。
在 if 判斷式中,else 部份能夠不用,但 then 是必需的。
(若 then 後不想跑任何 command ,可用" : " 這個 null command 代替)。
固然,then 或 else 後面,也能夠再使用更進一層的條件判斷式,這在 shell script 設計上
很常見。
如有多項條件須要"依序"進行判斷的話,那咱們則可以使用 elif 這樣的 keyword :
代碼:
if comd1; then
comd2
elif comd3; then
comd4
else
comd5
fi
意思是說:
若 comd1 爲 true ,然則執行 comd2 ﹔
不然再測試 comd3 ,然則執行 comd4 ﹔
假若 comd1 與 comd3 均不成立,那就執行 comd5 。
if 判斷式的例子很常見,你可從不少 shell script 中看獲得,我這裏就再也不舉例子了...
接下來要爲你們介紹的是 case 判斷式。
雖然 if 判斷式已可應付大部份的條件執行了,然而,在某些場合中,卻不夠靈活,
尤爲是在 string 式樣的判斷上,比方以下:
代碼:
QQ () {
echo -n "Do you want to continue? (Yes/No): "
read YN
if [ "$YN" = Y -o "$YN" = y -o "$YN" = "Yes" -o "$YN" = "yes" -o "$YN" = "YES" ]
then
QQ
else
exit 0
fi
}
QQ
從例中,咱們看得出來,最麻煩的部份是在於判斷 YN 的值可能有好幾種式樣。
聰明的你或許會如此修改:
代碼:
...
if echo "$YN" | grep -q '^[Yy]\([Ee][Ss]\)*$'
...
也就是用 Regular Expression 來簡化代碼。(咱們有機會再來介紹 RE)
只是... 是否有其它更方便的方法呢?
有的,就是用 case 判斷式便可:
代碼:
QQ () {
echo -n "Do you want to continue? (Yes/No): "
read YN
case "$YN" in
[Yy]|[Yy][Ee][Ss])
QQ
;;
*)
exit 0
;;
esac
}
QQ
咱們常 case 的判斷式來判斷某一變量在同的值(一般是 string)時做出不一樣的處理,
比方說,判斷 script 參數以執行不一樣的命令。
若你有興趣、且用 Linux 系統的話,不妨挖一挖 /etc/init.d/* 裏那堆 script 中的 case 用
法。
以下就是一例:
代碼:
case "$1" in
start)
start
;;
stop)
stop
;;
status)
rhstatus
;;
restart|reload)
restart
;;
condrestart)
[ -f /var/lock/subsys/syslog ] && restart || :
;;
*)
echo $"Usage: $0 {start|stop|status|restart|condrestart}"
exit 1
esac
(若你對 positional parameter 的印像已經模糊了,請重看第 9 章吧。)
okay,十三問還剩一問而已,過幾天再來搞定之.... ^_^
13) for what? while 與 until 差在哪?
終於,來到 shell 十三問的最後一問了... 長長吐一口氣~~~~
最後要介紹的是 shell script 設計中常見的"循環"(loop)。
所謂的 loop 就是 script 中的一段在必定條件下反覆執行的代碼。
bash shell 中經常使用的 loop 有以下三種:
* for
* while
* until
for loop 是從一個清單列表中讀進變量值,並"依次"的循環執行 do 到 done 之間的命令行。
例:
代碼:
for var in one two three four five
do
echo -----------
echo '$var is '$var
echo
done
上例的執行結果將會是:
1) for 會定義一個叫 var 的變量,其值依次是 one two three four five 。
2) 由於有 5 個變量值,所以 do 與 done 之間的命令行會被循環執行 5 次。
3) 每次循環均用 echo 產生三行句子。
而第二行中不在 hard quote 以內的 $var 會依次被替換爲 one two three four
five 。
4) 當最後一個變量值處理完畢,循環結束。
咱們不難看出,在 for loop 中,變量值的多寡,決定循環的次數。
然而,變量在循環中是否使用則不必定,得視設計需求而定。
假若 for loop 沒有使用 in 這個 keyword 來指定變量值清單的話,其值將從 $@ (或 $* )
中繼承:
代碼:
for var; do
....
done
(若你忘記了 positional parameter ,請溫習第 9 章...)
for loop 用於處理"清單"(list)項目很是方便,
其清單除了可明確指定或從 positional parameter 取得以外,
也可從變量替換或命令替換取得... (再一次提醒:別忘了命令行的"重組"特性﹗)
然而,對於一些"累計變化"的項目(如整數加減),for 亦能處理:
代碼:
for ((i=1;i<=10;i++))
do
echo "num is $i"
done
除了 for loop ,上面的例子咱們也可改用 while loop 來作到:
代碼:
num=1
while [ "$num" -le 10 ]; do
echo "num is $num"
num=$(($num + 1))
done
while loop 的原理與 for loop 稍有不一樣:
它不是逐次處理清單中的變量值,而是取決於 while 後面的命令行之 return value :
* 若爲 ture ,則執行 do 與 done 之間的命令,而後從新判斷 while 後的 return value 。
* 若爲 false ,則再也不執行 do 與 done 之間的命令而結束循環。
分析上例:
1) 在 while 以前,定義變量 num=1 。
2) 而後測試(test) $num 是否小於或等於 10 。
3) 結果爲 true ,因而執行 echo 並將 num 的值加一。
4) 再做第二輪測試,其時 num 的值爲 1+1=2 ,依然小於或等於 10,所以爲
true ,繼續循環。
5) 直到 num 爲 10+1=11 時,測試纔會失敗... 因而結束循環。
咱們不難發現:
* 若 while 的測試結果永遠爲 true 的話,那循環將一直永久執行下去:
代碼:
while :; do
echo looping...
done
上例的" : "是 bash 的 null command ,不作任何動做,除了送回 true 的 return value 。
所以這個循環不會結束,稱做死循環。
死循環的產生有多是故意設計的(如跑 daemon),也多是設計錯誤。
若要結束死尋環,可透過 signal 來終止(如按下 ctrl-c )。
(關於 process 與 signal ,等往後有機會再補充,十三問暫時略過。)
一旦你可以理解 while loop 的話,那,就能理解 until loop :
* 與 while 相反,until 是在 return value 爲 false 時進入循環,不然結束。
所以,前面的例子咱們也能夠輕鬆的用 until 來寫:
代碼:
num=1
until [ ! "$num" -le 10 ]; do
echo "num is $num"
num=$(($num + 1))
done
或是:
代碼:
num=1
until [ "$num" -gt 10 ]; do
echo "num is $num"
num=$(($num + 1))
done
okay ,關於 bash 的三個經常使用的 loop 暫時介紹到這裏。
在結束本章以前,再跟你們補充兩個與 loop 有關的命令:
* break
* continue
這兩個命令經常使用在複合式循環裏,也就是在 do ... done 之間又有更進一層的 loop ,
固然,用在單一循環中也何嘗不可啦... ^_^
break 是用來打斷循環,也就是"強迫結束" 循環。
若 break 後面指定一個數值 n 的話,則"從裏向外"打斷第 n 個循環,
默認值爲 break 1 ,也就是打斷當前的循環。
在使用 break 時須要注意的是, 它與 return 及 exit 是不一樣的:
* break 是結束 loop
* return 是結束 function
* exit 是結束 script/shell
而 continue 則與 break 相反:強迫進入下一次循環動做。
若你理解不來的話,那你可簡單的當作:在 continue 到 done 之間的句子略過而返回循環頂
端...
與 break 相同的是:continue 後面也可指定一個數值 n ,以決定繼續哪一層(從裏向外計算)
的循環,
默認值爲 continue 1 ,也就是繼續當前的循環。
在 shell script 設計中,若能善用 loop ,將能大幅度提升 script 在複雜條件下的處理能力。
請多加練習吧....
-----------
好了,該是到告終束的時候了。
婆婆媽媽的跟你們囉唆了一堆關於 shell 的基礎概念,
目的不是要告訴你們"答案",而是要帶給你們"啓發"...
在往後關於 shell 的討論中,我或許會常常用"連接"方式指引回來十三問中的內容,
以便咱們在進行技術探討時彼此能有一些討論基礎,而不至於各說各話、徒費時力。
但,更但願十三問能帶給你更多的思考與樂趣,至爲重要的是透過實做來加深理解。
是的,我很重視"實做"與"獨立思考"這兩項學習要素,若你可以掌握其中真義,那請容我說聲:
--- 恭喜﹗十三問你沒白看了﹗ ^_^
p.s.
至於補充問題部份,我暫時不寫了。而是但願:
1) 你們擴充題目。
2) 一塊兒來寫心得。
Good luck and happy studying!
b1) [^ ] 跟 [! ] 差在哪?
這個問題等了很久都沒人出來補充, 而我呢, 也被追殺了好幾次... ^_^
趁着今晚有一點空閒, 趕快將此樁心事作一告終吧...
這道題目說穿了, 就是要探討 Wildcard 與 Regular Expression 的差異的.
這也是許多初學 shell 的朋友很容易混亂的地方.
首先, 讓咱們回到十三問之第 2 問, 再一次將咱們提到的 command line format 溫習一次:
代碼:
command_name options arguments
同時, 也再來理解一下我在第 5 問所提到的變量替換的特性:
代碼:
先替換, 再重組 command lline!
有了這兩道基礎後, 才讓咱們來看看 wildcard 是甚麼回事吧.
Part-I: Wildcard
首先, wildcard 也是屬於 command line 的處理工序, 做用於 argument 裏的 path 之上.
沒錯, 它不用在 command_name 也不用在 options 上.
並且, 若 argument 不是 path 的話, 那也與 wildcard 無關.
換句更爲精確的定義來說, wildcard 是一種命令行的路徑擴展(path expansion)功能.
提到這個擴展, 那就不要忘記了 command line 的"重組"特性了!
是的, 這與變量替換(variable substitution)及命令替換(command substitution)的重組特
性是同樣的!
也就是在 wildcard 進行擴展後, 命令行會先完成重組纔會交給 shell 來處理.
瞭解了 wildcard 的擴展與重組特性後, 接下來, 讓咱們瞭解一些常見的 wildcard 吧:
*: 匹配 0 或多個字符
?: 匹配任意單一字符
[list]: 匹配 list 中的任意單一字符(注一)
[!list]: 匹配不在 list 中的任意單一字符
{string1,string2,...}: 匹配 sring1 或 string2 (或更多)其一字符串
(注一: list 能夠爲指定的個別字符, 如 abcd; 也能夠爲一段 ASCII 字符的起止範圍, 如:
a-d .)
例:
a*b: a 與 b 之間能夠有任意長度的任意字符, 也能夠一個也沒有, 如: aabcb, axyzb,
a012b, ab 等.
a?b: a 與 b 之間必須也只能有一個字符, 能夠是任意字符, 如: aab, abb, acb, a0b 等.
a[xyz]b: a 與 b 之間必須也只能有一個字符, 但只能是 x 或 y 或 z, 如: axb, ayb, azb
這三個.
a[!0-9]b: a 與 b 之間必須也只能有一個字符, 但不能是阿拉伯數字, 如: axb, aab, a-b 等.
a{abc,xyz,123}b: a 與 b 之間只能是 abc 或 xyz 或 123 這三個字符串之一, 如
aabcb, axyzb, a123b 這三個.
注意:
1) [! ] 中的 ! 只有放在第一順位時, 纔有排除之功. 舉例說:
[!a]* 表示當前目錄下全部不以 a 開首的路徑名稱.
/tmp/[a\!]* 表示 /tmp 目錄下以 a 或 ! 開首的路徑名稱. (思考: 爲什麼 ! 前面要加 \ 呢?
提示: 十三問之 4 )
2) [ -] 中的 - 左右兩邊均有字符時, 才表示一段範圍, 不然僅做 "-"(減號) 字符來處理. 舉
例說:
/tmp/*[-z]/[a-zA-Z]* 表示 /tmp 目錄下全部以 z 或 - 結尾的子目錄下以英文字母(不分
大小寫)開首的路徑名稱.
3) 以 * 或 ? 開首的 wildcard 不能匹配隱藏文件(即以 . 開首的文件). 舉例說:
*.txt 並不能匹配 .txt 但可匹配 1.txt 這樣的路徑名稱.
但 1*txt 及 1?txt 都可匹配 1.txt 這樣的路徑名稱.
基本上, 要掌握 wildcard 並不難, 只要多加練習, 再勤于思考, 就能熟加運用了.
再次提醒: 別忘了"擴充+重組"這個重要特性, 並且只做用在 argument 的 path 上.
比方說, 假設當前目錄下有 a.txt b.txt c.txt 1.txt 2.txt 3.txt 這幾份文件.
當咱們在命令行中下達 ls -l [0-9].txt 的命令行時,
由於 wildcard 處於 argument 的位置上, 因而根據其匹配的路徑, 擴展爲 1.txt 2.txt
3.txt ,
再重組出 ls -l 1.txt 2.txt 3.txt 這樣的命令行.
所以, 你在命令行上敲 ls -l [0-9].txt 與 ls -l 1.txt 2.txt 3.txt 都是一樣的結果, 其緣由正
是於此了...
Part-II: Regular Expression
接下來的 Regular Expression(RE) 但是個大題目, 要講的不少, 我這裏固然不可能講得很完
全.
只但願帶給你們一個基本的入門概念, 就非常足夠了...
先來考一下英文好了: What is expression?
簡單來講, 就是"表達", 也就是人們在溝通時所要陳述的內容.
然而, 生活中, 表達方要清楚的將意思描述清楚而讓接收方完整且無誤的領會, 可不是件容易
的事情.
於是纔會出現那麼多的"誤會", 真可嘆句"表達不易"啊....
一樣的情形也發生在計算機的數據處理過程當中, 尤爲是當咱們在描術一段"文字內容"的時候...
那麼, 咱們不由要問: 有何方法可讓你們的誤會降至最低程度而讓表達的精確度達到最高程
度呢?
答案就是"標準化"了, 亦就是咱們這裏要談的 Regular Expression 啦.... ^_^
然而, 在進入 RE 介紹以前, 不防先讓咱們溫習一下 shell 十三問第 4 問, 也就是關於
quoting 的部份.
關鍵是要可以區分 shell command line 上的 meta 與 literal 這兩種不一樣的字符類別.
而後, 我這裏纔跟你講:
--- RE 表達式裏的字符也是分爲 meta 與 literal 這兩種!
呵, 不知親愛的讀者是否被我搞混亂了呢? ... ^_^
這也難怪啦, 由於這的確是最容易混亂的地方, 剛學 RE 的朋友不少時候都死在這裏!
所以請特別當心理解哦...
簡單而言, 除非你將 RE 寫在特定程序使用的腳本里,
不然, 咱們的 RE 也是透過 command line 輸入的.
然而, 很多 RE 所始用的 meta 字符, 跟 shell meta 字符是衝突的.
比方說, * 這個字符, 在 RE 裏是一個 modifier(後述), 在 command line 上, 倒是個
wildcard !
那麼, 咱們該如何解決這樣的衝突呢? 關鍵就是看你對十三問第 4 問所提的 quoting 是否夠
理解了!
若你明白到 shell quoting 就是在 command line 上關閉 shell meta 這一基本原理,
那你就能很輕鬆的解決 RE meta 與 shell meta 的衝突問題了:
--- 用 shell quoting 關掉 shell meta 就是了!
就這麼簡單... ^_^
再以剛提到的 * 字符爲例, 若在 command line 中沒有 quoting 處理的話, 如 abc* ,
那就會被做爲 wildcard expansion 來擴充及重組了.
若將之置於 quoting 中, 如 "abc*", 則可避免 wildcard expansion 的處理. (注一)
(* 注一:
是否須要 quoting 得視具體的程序及具體的命令語法而定. 以 grep 爲例:
假設當前目錄下有 abc 與 abc-xyz 這兩份文件, 其中 abc 文件的內容就是 abc 這行文字.
當咱們在 command line 輸入 grep abc* abc* 的時候,
第一個 abc* 事實上並不須要 quoting 就可避免 wildcard 處理, 而第二個 abc* 則會被
擴展爲 abc abc-xyz .
在命令行重組後, 將會成爲 grep abc* abc abc-xyz . 其輸出結果會是: abc:abc
然而, 若咱們的 command line 改成 echo abc | grep abc* 的話, 若沒 quoting 處理的
話, * 會被視爲 wildcard ,
在命令行重組後, 將會成爲 echo abc | grep abc abc-xyz . 將得不到任何輸出結果.
要想獲得結果的話, 那 command line 應改成: echo abc | grep "abc*"
)
好了, 說了大半天, 還沒進入正式的 RE 介紹呢...
你們別急, 由於個人教學風格就是要先創建基礎, 按部就班的... ^_^
所以, 我這裏還要在囉唆一個觀念, 纔會到 RE 的說明啦... (哈... 別打我....)
當咱們在談到 RE 時, 千萬別跟 wildcard 搞混在一塊兒!
尤爲在 command line 的位置裏, wildcard 只做用於 argument 的 path 上.
可是 RE 卻只用於"字符串處理"的程序之中, 這與路徑名稱一點關係也沒有!
RE 所處理的字符串一般是指純文檔或透過 stdin 讀進的內容...
okay, 夠了夠了, 我已看到一堆人開始出現不大耐煩的樣子了.... ^_^
如今, 就讓我門登堂入室, 撩開 RE 的神祕面紗吧, 這樣能夠放過我了吧? 哈哈...
在 RE 的表達式裏, 主要分兩種字符(character): literal 與 meta.
所謂 literal 就是在 RE 裏不具特殊功能的字符, 如 abc, 123 這些;
而 meta 在 RE 裏具備特殊的功能, 要關閉之需在 meta 前面使用 escape( \ )字符.
然而, 在介紹 meta 以前, 先讓咱們來認識一下字符組合(character set)會更好些.
所謂的 char. set 就是將多個連續的字符做一個集合, 比方說:
abc: 表示 abc 三個連續的字符, 但彼此獨立而非集合. (可簡單視爲三個 char. set)
(abc): 表示 abc 這三個連續字符的集合. (可簡單視爲一個 char. set)
abc|xyz: 表示或 abc 或 xyz 這兩個 char. set 之一.
[abc]: 表示單一字符, 可爲 a 或 b 或 c . (與 wildcard 之 [abc] 原理相同)
[^abc]: 表示單一字符, 不爲 a 或 b 或 c 便可. (與 wildcard 之 [!abc] 原理相同)
. : 表示任意單一字符. (與 wildcard 之 ? 原理相同)
在認識了 char. set 這個概念後, 而後再讓咱們多認識幾個 RE 中常見的 meta 字符:
- 錨點(anchor)
用以標識 RE 於句子中的位置所在. 常見有:
^: 表示句首. 如 ^abc 表示以 abc 開首的句子.
$: 表示句尾. 如 abc$ 表示以 abc 結尾的句子.
\<: 表示詞首. 如 \<abc 表示以 abc 開首的詞.
\>: 表示詞尾. 如 abc\> 表示以 abc 結尾的詞.
- 修飾字符(modifier)
獨立表示時自己不具意義, 專門用以修改前一個 char. set 的出現次數. 常見有:
*: 表示前一個 char. set 的出現次數爲 0 或屢次. 如 ab*c 表示 a 與 c 之間可有 0 或多
個 b 存在.
?: 表示前一個 char. set 的出現次數爲 0 或 1 次. 如 ab?c 表示 a 與 c 之間可有 0 或
1 個 b 存在.
+: 表示前一個 char. set 的出現次數爲 1 或屢次. 如 ab+c 表示 a 與 c 之間可有 1 或
多個 b 存在.
{n}: 表示前一個 char. set 的出現次數必須爲 n 次. 如 ab{3,}c 表示 a 與 c 之間必須
有 3 個 b 存在.{n,}: 表示前一個 char. set 的出現次數至少爲 n 次. 如 ab{3,}c 表示
a 與 c 之間至少有 3 個 b 存在.
{n,m}: 表示前一個 char. set 的出現次數爲 n 到 m 次. 如 ab{3,5}c 表示 a 與 c 之
間有 3 到 5 個 b 存在.
然而, 當咱們在識別 modifier 時, 卻很容易忽略"邊界(boundary)"字符的重要性.
以剛提到的 ab{3,5}c 爲例, 這裏的 a 與 c 就是邊界字符了.
若沒有邊界字符的幫忙, 咱們很容以做出錯誤的解讀.
比方說: 咱們用 ab{3,5} 這個 RE (少了 c 這個邊界字符)能夠抓到 abbbbbbbbbbc (a 後
有 10 個 b )這串字嗎?
從剛纔的 modifier 咱們通常會認爲咱們要的 b 是 3 到 5 個, 若超出了此範圍, 就不是我
們要表達的.
所以, 咱們或會很輕率的認爲這個 RE 抓不到結果...
然而答案倒是能夠的! 爲甚麼呢?
讓咱們從新解讀 ab{3,5} 這個 RE 看看:
咱們要表達的是 a 後接 3 到 5 個 b 便可, 但 3 到 5 個 b 後面咱們卻沒規定是甚麼,
所以在 RE 後面能夠是任意的文字, 固然包括 b 也能夠啦! (明白了嗎?)
一樣的, 咱們用 b{3,5}c 也一樣能夠抓到 abbbbbbbbbbc 這串字的.
但咱們若使用 ab{3,5}c 這樣的 RE 時, 因爲同時有 a 與 c 這兩個邊界字符, 那就截然不
同了!
有空再思考一下, 爲什麼咱們用下面這些 RE 均可抓到 abc 這串字呢?
x*
ax*, abx*, ax*b
abcx*, abx*c, ax*bc
bx*c, bcx*, x*bc
...(還有更多...)
但, 若咱們在這些 RE 先後分別加一個 ^ 與 $ 這樣的 anchor, 那又如何呢?
剛學 RE 時, 只要能掌握上面這些基本的 meta 大蓋就能夠入門了.
一如前述, RE 是一種規範化的文字表達方式, 主要用於某些文字處理工具之間,
如 grep, perl, vi, awk, sed, 等等. 經常使用以表示一段連續的字符串, 捕獲之或替換之.
然而, 每種工具對 RE 表達式的具體解讀或有一些細微差別, 不過, 基本原則仍是一致的.
只要能掌握 RE 的基本原理, 那就一理通百理明瞭, 只是在實做時稍加變通便可.
比方以 grep 來講, 在 Linux 上你可找到 grep, egrep, fgrep 這幾個程序, 其差別大體如
下:
* grep:
傳統的 grep 程序, 在沒有參數的狀況下, 只輸出符合 RE 字符串之句子. 常見參數以下:
-v: 逆反模示, 只輸出"不含" RE 字符串之句子.
-r: 遞歸模式, 可同時處理全部層級子目錄裏的文件.
-q: 靜默模式, 不輸出任何結果(stderr 除外. 經常使用以獲取 return value, 符合爲 true, 不然
爲 false .)
-i: 忽略大小寫.
-w: 整詞比對, 相似 \<word\> .
-n: 同時輸出行號.
-c: 只輸出符合比對的行數.
-l: 只輸出符合比對的文件名稱.
-o: 只輸出符合 RE 的字符串. (gnu 新版獨有, 不見得全部版本都支持.)
-E: 切換爲 egrep .
* egrep:
爲 grep 的擴充版本, 改良了許多傳統 grep 不能或不便的操做. 比方說:
- grep 之下不支持 ? 與 + 這兩種 modifier, 但 egrep 則可.
- grep 不支持 a|b 或 (abc|xyz) 這類"或一"比對, 但 egrep 則可.
- grep 在處理 {n,m} 時, 需用 \{ 與 \} 處理, 但 egrep 則不需.
諸如此類的... 我我的會建議能用 egrep 就不用 grep 啦... ^_^
* fgrep:
不做 RE 處理, 表達式僅做通常字符串處理, 全部 meta 均失去功能.
好了...
關於 RE 的入門, 我暫時就介紹到這裏.
雖然寫得有點亂, 且有些觀念也不很精確, 不過, 姑且算是對你們有一個交差吧.... ^_^
若這兩天還有時間的話, 我再舉些範例來分析一下, 以助你們更好的理解.
假如更有可能的話, 也順道爲你們介紹一下 sed 這個工具.
(啊, 此次我不敢做保證了哦... ^_^ )
----------------
(順道一提: eval )
講到 command line 的重組特性, 真的須要咱們好好的加以理解的.
如此便能抽絲剝襺的一層層的將正個 command line 分析得一清二楚, 而不至於含糊.
假如這個重組特性理解下來來, 那麼, 接下來咱們介紹一個好玩的命令 --- eval .
咱們在很多變量替換的過程當中, 常碰到所謂的複式變量的問題, 如:
代碼:
a=1
A1=abc
咱們都知道 echo $A1 就可獲得 abc 這個結果.
然而, 咱們可否用 $A$a 來取代 $A1 而一樣替換出 abc 呢?
這個問題咱們可用很輕鬆的用 eval 來解決:
代碼:
eval echo \$A$a
說穿了, eval 只不過是在命令行完成替換重組後, 再來一次替換重組罷了...
就是這麼簡單啦~~~ ^_^php

相關文章
相關標籤/搜索