在 awk 系列的第八節,咱們介紹了一些強大的 awk 命令功能,它們是變量、數字表達式和賦值運算符。linux
本節咱們將學習更多的 awk 功能,即 awk 的特殊模式:BEGIN
和 END
。git
學習 awk 的模式 BEGIN 和 ENDgithub
隨着咱們逐漸展開,並探索出更多構建複雜 awk 操做的方法,將會證實 awk 的這些特殊功能的是多麼強大。正則表達式
開始前,先讓咱們回顧一下 awk 系列的介紹,記得當咱們開始這個系列時,我就指出 awk 指令的通用語法是這樣的:shell
# awk 'script' filenames
在上述語法中,awk 腳本擁有這樣的形式:windows
/pattern/ { actions }
你一般會發現腳本中的模式(/pattern/
)是一個正則表達式,不過你也能夠將模式使用特殊模式 BEGIN
和 END
。所以,咱們也能按照下面的形式編寫一條 awk 命令:bash
awk ' BEGIN { actions } /pattern/ { actions } /pattern/ { actions } ………. END { actions } ' filenames
假如你在 awk 腳本中使用了特殊模式:BEGIN
和 END
,如下則是它們對應的含義:dom
BEGIN
模式:是指 awk 將在讀取任何輸入行以前當即執行 BEGIN
中指定的動做。END
模式:是指 awk 將在它正式退出前執行 END
中指定的動做。含有這些特殊模式的 awk 命令腳本的執行流程以下:ide
BEGIN
模式,則 BEGIN
中全部的動做都會在讀取任何輸入行以前執行。END
模式,那麼將會執行相應的動做。當你使用特殊模式時,想要在 awk 操做中得到最好的結果,你應當記住上面的執行順序。學習
爲了便於理解,讓咱們使用第八節的例子進行演示,那個例子是關於 Tecmint 擁有的域名列表,並保存在一個叫作 domains.txt 的文件中。
news.tecmint.com tecmint.com linuxsay.com windows.tecmint.com tecmint.com news.tecmint.com tecmint.com linuxsay.com tecmint.com news.tecmint.com tecmint.com linuxsay.com windows.tecmint.com tecmint.com
$ cat ~/domains.txt
查看文件內容
在這個例子中,咱們但願統計出 domains.txt 文件中域名 tecmint.com
出現的次數。因此,咱們編寫了一個簡單的 shell 腳本幫助咱們完成任務,它使用了變量、數學表達式和賦值運算符的思想,腳本內容以下:
#!/bin/bash for file in $@; do if [ -f $file ] ; then ### 輸出文件名 echo "File is: $file" ### 輸出一個遞增的數字記錄包含 tecmint.com 的行數 awk '/^tecmint.com/ { counter+=1 ; printf "%s\n", counter ; }' $file else ### 若輸入不是文件,則輸出錯誤信息 echo "$file 不是一個文件,請指定一個文件。" >&2 && exit 1 fi done ### 成功執行後使用退出代碼 0 終止腳本 exit 0
如今讓咱們像下面這樣在上述腳本的 awk 命令中應用這兩個特殊模式:BEGIN
和 END
:
咱們應當把腳本:
awk '/^tecmint.com/ { counter+=1 ; printf "%s\n", counter ; }' $file
改爲:
awk ' BEGIN { print "文件中出現 tecmint.com 的次數是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s\n", counter ; } ' $file
在修改了 awk 命令以後,如今完整的 shell 腳本就像下面這樣:
#!/bin/bash for file in $@; do if [ -f $file ] ; then ### 輸出文件名 echo "File is: $file" ### 輸出文件中 tecmint.com 出現的總次數 awk ' BEGIN { print "文件中出現 tecmint.com 的次數是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s\n", counter ; } ' $file else ### 若輸入不是文件,則輸出錯誤信息 echo "$file 不是一個文件,請指定一個文件。" >&2 && exit 1 fi done ### 成功執行後使用退出代碼 0 終止腳本 exit 0
awk 模式 BEGIN 和 END
當咱們運行上面的腳本時,它會首先輸出 domains.txt 文件的位置,而後執行 awk 命令腳本,該命令腳本中的特殊模式 BEGIN
將會在從文件讀取任何行以前幫助咱們輸出這樣的消息「文件中出現 tecmint.com 的次數是:
」。
接下來,咱們的模式 /^tecmint.com/
會在每一個輸入行中進行比較,對應的動做 { counter+=1 ; }
會在每一個匹配成功的行上執行,它會統計出 tecmint.com
在文件中出現的次數。
最終,END
模式將會輸出域名 tecmint.com
在文件中出現的總次數。
$ ./script.sh ~/domains.txt
用於統計字符串出現次數的腳本
最後總結一下,咱們在本節中演示了更多的 awk 功能,並學習了特殊模式 BEGIN
和 END
的概念。
正如我以前所言,這些 awk 功能將會幫助咱們構建出更復雜的文本過濾操做。第十節將會給出更多的 awk 功能,咱們將會學習 awk 內置變量的思想,因此,請繼續保持關注。
via: http://www.tecmint.com/learn-use-awk-special-patterns-begin-and-end/
做者:Aaron Kili
譯者:ChrisLeeGit
校對:wxy