如何使用 awk 按模式篩選文本或字符串

時間 2019-11-24

原文原文鏈接

在篩選文本時，有時你可能想根據某個給定的條件或使用一個可被匹配的特定模式，去標記某個文件或數行字符串中的某幾行。使用 awk 來完成這個任務是很是容易的，這也正是 awk 中可能對你有所幫助的幾個功能之一。html

讓咱們看一看下面這個例子，比方說你有一個寫有你想要購買的食物的購物清單，其名稱爲 food_prices.list，它所含有的食物名稱及相應的價格以下所示：linux

$ cat food_prices.list 
No  Item_Name       Quantity    Price
1   Mangoes            10       $2.45
2   Apples             20       $1.50
3   Bananas            5        $0.90
4   Pineapples         10       $3.46
5   Oranges            10       $0.78
6   Tomatoes           5        $0.55
7   Onions             5        $0.45

而後，你想使用一個 (*) 符號去標記那些單價大於 $2 的食物，那麼你能夠經過運行下面的命令來達到此目的：app

$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $1, $2, $3, $4, "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list

打印出單價大於 $2 的項目spa

從上面的輸出你能夠看到在含有芒果（和菠蘿的那行末尾都已經有了一個 (*) 標記。假如你檢查它們的單價，你能夠看到它們的單價的確超過了 $2 。htm

在這個例子中，咱們已經使用了兩個模式：
第一個模式: / */$[2-9]/.[0-9][0-9] */ 將會獲得那些含有食物單價大於 $2 的行。
第二個模式: /*/$[0-1]/.[0-9][0-9] */ 將查找那些食物單價小於 $2 的那些行。

上面的命令具體作了什麼呢？這個文件有四個字段，當模式一匹配到含有食物單價大於 $2 的行時，它便會輸出全部的四個字段並在該行末尾加上一個 (*) 符號來做爲標記。字符串

第二個模式只是簡單地輸出其餘含有食物單價小於 $2 的行，按照它們出如今輸入文件 food_prices.list 中的樣子。string

這樣你就可使用模式來篩選出那些價格超過 $2 的食物項目，儘管上面的輸出還有些問題，帶有 (*) 符號的那些行並無像其餘行那樣被格式化輸出，這使得輸出顯得不夠清晰。it

咱們在 awk 系列的第二部分中也看到了一樣的問題，但咱們可使用下面的兩種方式來解決：io

一、能夠像下面這樣使用 printf 命令，但這樣使用又長又無聊：class

$ awk '/ */$[2-9]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4 "*" ; } / */$[0-1]/.[0-9][0-9] */ { printf "%-10s %-10s %-10s %-10s/n", $1, $2, $3, $4; }' food_prices.list

使用 Awk 和 Printf 來篩選和輸出項目

二、使用 $0 字段。Awk 使用變量 0 來存儲整個輸入行。對於上面的問題，這種方式很是方便，而且它還簡單、快速：

$ awk '/ */$[2-9]/.[0-9][0-9] */ { print $0 "*" ; } / */$[0-1]/.[0-9][0-9] */ { print ; }' food_prices.list

使用 Awk 和變量來篩選和輸出項目

結論

這就是所有內容了，使用 awk 命令你即可以經過幾種簡單的方法去利用模式匹配來篩選文本，幫助你在一個文件中對文本或字符串的某些行作標記。

本文轉載地址：https://www.linuxprobe.com/awk-filt-string.html

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。