【必學】Linux 下三劍客的技能,你敢不學?

【必學】Linux 下三劍客的技能,你敢不學?

awk是一種用於處理文本、模式匹配的編程語言。與sed和grep,俗稱Linux下的三劍客。學會 awk 等於你在 Linux 命令行裏,又多了一種處理文本的選擇。這篇文章重點教你如何使用,看完這篇文章,就大體知道如何使用了,力求簡單使用。python

術語鋪墊

在awk的文本處理規則裏,awk將文本文件視爲由字段和記錄組成的文本數據庫。默認狀況下,awk將每一行視爲一個記錄,也就是說記錄的分隔符是\n,記錄的分隔符能夠經過內置變量RS更改。數據庫

在每個記錄中,又把記錄分爲若干個字段,即記錄由字段組成,而字段的默認分隔符爲空格或製表符。編程

1、基礎用法

和咱們日常使用的 Linux 命令同樣, awk 也是遵循着某種格式來使用,格式以下:編程語言

# 使用格式
awk 執行的事件 文件

# 例如:
[root@iamshuaidi ~]# awk '{print $0}' test.txt
my first language:Java
second languange:python
third language:C

注:能夠左右拉動ide

其中,print 表示打印,$0 表示一整個記錄,test.txt 表示一個文件。因此函數

awk '{print $0}' test.txt

表示把 test.txt 文件裏面的每行記錄都打印出來。命令行

剛纔咱們說,記錄是由字段組成的,且字段的默認分隔符是空格或者製表符。下面咱們打印每個記錄的第一個字段,以下:code

# 打印每一行的第一個字段
[root@iamshuaidi # awk '{print $1}' test.txt
my
second
third

$0 表示整個記錄,不過 $1, $2, $3.....則表示整個記錄中的第一個字段,第二個字段......。blog

剛纔咱們說字段的默認分隔符是空格或者製表符這些,默認意味着咱們能夠本身顯式着指定分隔符。下面咱們用「:」來做爲咱們的分隔符吧。事件

# 打印第二個字段
[root@iamshuaidi ~]# awk -F ':' '{print $2}' test.txt
Java
python
C

上面咱們用參數 -F 指定了咱們的分隔符,即若是想要指定字段的分隔符,能夠用參數 -F 指定分隔符。

2、條件限制

在打印文本的時候,咱們能夠指定一些條件。格式以下:

awk 參數 條件 要執行的動做 文件

例如咱們指定分隔符爲「:」,條件爲第二個字段爲"Java"的記錄。

# 打印第二個字段爲"Java"的文本
[root@iamshuaidi ~]# awk -F ':''$2 == "Java" {print $2}' test.txt
Java

打印奇數行的的第二個字段:

# 打印奇數行的記錄
[root@iamshuaidi ~]# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt
Java
C

其中,NR 是一個內置的變量,表示當前正在處理的記錄,即當前的記錄是第幾個記錄。

3、條件語句

和咱們日常的編程同樣,awk 也提供了 if, else, while 等這些條件語句。

例如,打印第二個及其以後的記錄:

root@iamshuaidi ~]# awk '{if(NR > 1) print $2}' test.txt
languange:python
language:C

注意,上面的字段分隔符是空格了,而且 if 語句是在「{}」 裏指定的。

再看一個例子:

# 若是第一個字段大於「s",則打印第一個字段,不然打印第二個字段
[root@iamshuaidi ~]# awk '{if($1 < "s") print $1; else print $2}' test.txt
my
languange:python
language:C

注:能夠左右拉動

上面打印的是:若是第一個字段大於「s",則打印第一個字段,不然打印第二個字段。

4、函數

awk 提供了一些內置函數來供咱們使用,一下經常使用的函數以下:

tolower():字符轉爲小寫。
toupper():字符轉爲大寫
length():返回字符串長度。
substr():返回子字符串。
sqrt():平方根。
rand():隨機數。

例如,咱們要把打印的字段轉化爲大小

# 第一個字段轉化爲大寫輸出
[root@iamshuaidi ~]# awk '{print toupper($1)}' test.txt
MY
SECOND
THIRD

5、變量

剛纔咱們說 NR 是一個表示當前正在處理的記錄是第幾個記錄的內置變量,經常使用的內置變量以下:

NR:表示當前處理的是第幾行
NF:表示當前行有多少個字段
FILENAME:當前文件名
FS:字段分隔符,默認是空格和製表符。
RS:行分隔符,用於分割每一行,默認是換行符。
OFS:輸出字段的分隔符,用於打印時分隔字段,默認爲空格。
ORS:輸出記錄的分隔符,用於打印時分隔記錄,默認爲換行符。

例如咱們要打印每個記錄的最後一個字段,就可使用變量 NF 了。

[root@iamshuaidi ~]# awk '{print $NF}' test.txt
language:Java
languange:python
language:C

對了,剛纔那個 NR 的變量也是挺好用的,例如:

# 標記當前是第幾行,這樣看起來好像比較舒服?
[root@iamshuaidi ~]# awk '{print NR ". "  $0}' test.txt
1. my first language:Java
2. second languange:python
3. third language:C

講到這裏就大體結束了,這篇文章算是入門文章,屏蔽了不少細節,大體介紹一下怎麼使用,更多具體用法,能夠根據本身想要實現的功能去查找相關函數哦。

有收穫?點擊底部卡片加個雞腿犒勞一下?

  • End -

推薦閱讀:

你真的瞭解 i++, ++i 和 i+++++i 以及 i+++i++ 嗎?
談談NAT:什麼?全球IP和私有IP是什麼鬼?
【必學】Linux 下三劍客的技能,你敢不學?

相關文章
相關標籤/搜索