awk介紹 awk基本用法 awk變量 awk格式化 awk操做符 awk條件判斷 awk循環 awk數組 awk函數 調用系統命令
AWK介紹linux
awk:Aho, Weinberger, Kernighan,報告生成器,格式化文本輸出 有多種版本:New awk(nawk),GNU awk( gawk) gawk:模式掃描和處理語言 基本用法: awk [options] ‘program’ var=value file… awk [options] -f programfile var=value file… awk [options] 'BEGIN{ action;… } pattern{ action;… } END{ action;… }' file ... awk 程序一般由:BEGIN語句塊、可以使用模式匹配的通用語句塊、END語句塊,共3部 分組成 program一般是被單引號或雙引號中 選項: -F 指明輸入時用到的字段分隔符 -v var=value: 自定義變量
AWK語言正則表達式
基本格式:awk [options] 'program' file… program:pattern{action statements;..} pattern和action: • pattern部分決定動做語句什麼時候觸發及觸發事件 BEGIN,END • action statements對數據進行處理,放在{}內指明 print, printf 分割符、域和記錄 • awk執行時,由分隔符分隔的字段(域)標記$1,$2..$n稱爲域標識。$0爲全部域, 注意:和shell中變量$符含義不一樣 • 文件的每一行稱爲記錄 • 省略action,則默認執行 print $0 的操
awk工做原理shell
第一步:執行BEGIN{action;… }語句塊中的語句 第二步:從文件或標準輸入(stdin)讀取一行,而後執行pattern{ action;… }語句塊,它 逐行掃描文件,從第一行到最後一行重複這個過程,直到文件所有被讀取完畢。 第三步:當讀至輸入流末尾時,執行END{action;…}語句塊 BEGIN語句塊在awk開始從輸入流中讀取行以前被執行,這是一個可選的語句塊,好比 變量初始化、打印輸出表格的表頭等語句一般能夠寫在BEGIN語句塊中 END語句塊在awk從輸入流中讀取完全部的行以後即被執行,好比打印全部行的分析 結果這類信息彙總都是在END語句塊中完成,它也是一個可選語句塊 pattern語句塊中的通用命令是最重要的部分,也是可選的。若是沒有提供pattern語句 塊,則默認執行{ print },即打印每個讀取到的行,awk讀取的每一行都會執行該語句塊
AWKexpress
print格式: print item1, item2, ... 要點: (1) 逗號分隔符 (2) 輸出的各item能夠字符串,也能夠是數值;當前記錄的字段、變量或awk的表達式 (3) 如省略item,至關於print $0 示例: awk '{print "hello,awk"}' awk –F: '{print}' /etc/passwd awk –F: ‘{print 「wang」}’ /etc/passwd awk –F: ‘{print $1}’ /etc/passwd awk –F: ‘{print $0}’ /etc/passwd awk –F: ‘{print $1」\t」$3}’ /etc/passwd【"\t" 表明一個tab鍵】 tail –3 /etc/fstab |awk ‘{print $2,$4}’ df |sed '1d' |awk -F "[ %]+" '{print $5}' 【取用的百分比, 「[ %]+」 說明他支持擴展正則表達式】 例:[root@centos7 04:41:20 ~]#df |grep "/dev/sd" |awk -F " +|%" '{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 [root@centos7 04:41:26 ~]#df |grep "/dev/sd" |awk -F "[ %]+" '{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 [root@centos23:10:50bin]#df |awk -F " +|%" '$0 ~ /^\/dev\/sd/ {print $1,$5}'
AWK變量centos
變量:內置和自定義變量 FS:輸入字段分隔符,默認爲空白字符 awk -v FS=':' '{print $1,FS,$3}’ /etc/passwd awk –F: '{print $1,$3,$7}’ /etc/passwd、 例: 在shell中定義一個變量 fs=: awk -v FS=$fs '{print $1FS$2}' /etc/passwd OFS:輸出字段分隔符,默認爲空白字符 awk -v FS=‘:’ -v OFS=‘:’ '{print $1,$3,$7}’ /etc/passwd awk -v FS=: -v OFS="\n" '{print $1,$3}' /etc/passwd awk -v FS=: -v OFS="=====" '{print $1,$3}' /etc/passwd RS:輸入記錄分隔符,指定輸入時的換行符 awk -v RS=' ' ‘{print }’ /etc/passwd 例:[root@centos7 03:53:52 ~]#cat f1.txt a,d,c;1,2,3,4;A,B,C aa,bb,dd [root@centos7 03:53:54 ~]#awk -v FS=',' -v RS=";" '{print $3,$4}' f1.txt c 3 4 C aa bb [root@centos7 03:58:16 ~]#awk -v FS=',' -v OFS="===" -v RS=";" '{print $3,$3}' f1.txt c===c 3===3 C aa===C aa ORS:輸出記錄分隔符,輸出時用指定符號代替換行符 awk -v RS=' ' -v ORS='###'‘{print }’ /etc/passwd 例:[root@centos7 03:53:52 ~]#cat f1.txt a,d,c;1,2,3,4;A,B,C aa,bb,dd [root@centos7 04:02:23 ~]#awk -v FS=',' -v OFS="===" -v RS=";" -v ORS="----" '{print $3,$3}' f1.txt c===c----3===3----C aa===C aa---- NF:字段數量 awk -F: ‘{print NF}’ /etc/fstab,引用內置變量不用$ awk -F: '{print $(NF-1)}' /etc/passwd 例:[root@centos7 04:07:51 ~]#df |awk -F " " '{print $(NF-1)}' Mounted 8% 0% 0% 2% 0% 1% 17% NR:記錄號 awk '{print NR}' /etc/fstab ; awk END'{print NR}' /etc/fstab 例:[root@centos7 04:11:04 ~]#df |awk -F " " '{print NR,$5}' 1 Use% 2 8% 3 0% 4 0% 5 2% 6 0% 7 1% 8 17% FNR:各文件分別計數,記錄號 awk '{print FNR}' /etc/fstab /etc/inittab 例:[root@centos7 04:14:11 ~]#awk -F " " '{print FNR,$1}' f1.txt /etc/passwd 1 a,d,c;1,2,3,4;A,B,C 2 aa,bb,dd 1 root:x:0:0:root:/root:/bin/bash 2 bin:x:1:1:bin:/bin:/sbin/nologin 3 daemon:x:2:2:daemon:/sbin:/sbin/nologin 4 adm:x:3:4:adm:/var/adm:/sbin/nologin FILENAME:當前文件名 awk '{print FILENAME}’ /etc/fstab ARGC:命令行參數的個數 awk '{print ARGC}’ /etc/fstab /etc/inittab awk ‘BEGIN {print ARGC}’ /etc/fstab /etc/inittab ARGV:數組,保存的是命令行所給定的各參數 awk ‘BEGIN {print ARGV[0]}’ /etc/fstab /etc/inittab awk ‘BEGIN {print ARGV[1]}’ /etc/fstab /etc/inittab
AWK變量數組
自定義變量(區分字符大小寫) (1) -v var=value (2) 在program中直接定義 示例: awk -v test='hello gawk' '{print test}' /etc/fstab awk -v test='hello gawk' 'BEGIN{print test}' awk 'BEGIN{test="hello,gawk";print test}' awk –F:‘{sex=「male」;print $1,sex,age;age=18}’ /etc/passwd cat awkscript {print script,$1,$2} 例:[root@centos7 04:23:27 ~]#awk -F: -v USER="username" -v UID="userid" -v ORS="\n------------\n" '{print USER":"$1"\n"UID":"$3 }' /etc/passwd username:root userid:0 ------------ username:colord userid:996 ------------ username:gluster userid:995 ------------ username:saslauth userid:994 ------------ username:abrt userid:173 ------------ username:setroubleshoot userid:993 ------------ username:rtkit userid:172 awk -F: -f awkscript script=「awk」 /etc/passwd 例:[root@centos7 04:36:38 ~]#cat awk.txt {print USER":"$1"\n"UID":"$3;USER="username";UID="userid"} [root@centos7 04:36:51 ~]#awk -F: -f awk.txt /etc/passwd :root :0 username:bin userid:1 username:daemon userid:2 username:adm userid:3 username:lp userid:4 username:sync userid:5
printf命令bash
格式化輸出:printf 「FORMAT」, item1, item2, ... (1) 必須指定FORMAT (2) 不會自動換行,須要顯式給出換行控制符,\n (3) FORMAT中須要分別爲後面每一個item指定格式符 格式符:與item一一對應 %c: 顯示字符的ASCII碼 %d, %i: 顯示十進制整數 %e, %E:顯示科學計數法數值 %f:顯示爲浮點數 %g, %G:以科學計數法或浮點形式顯示數值 %s:顯示字符串 %u:無符號整數 %%: 顯示%自身 修飾符: #[.#]:第一個數字控制顯示的寬度;第二個#表示小數點後精度,%3.1f -: 左對齊(默認右對齊) %-15s +:顯示數值的正負符號 %+d 例:[root@centos7 04:54:42 ~]#awk -F: '{printf "%-30s|%10d\n", $1,$3}' /etc/passwd root | 0 bin | 1 daemon | 2 adm | 3 lp | 4 sync | 5 shutdown | 6 halt | 7 mail | 8 operator | 11 games | 12 ftp | 14 nobody | 99 systemd-network | 192 例:[root@centos7 05:13:12 ~]#echo "1.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}' 1.2 23.45[root@centos7 05:echo "10.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}'' 10.2 23.45[root@centos7 05:13:32 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %4.2f",$1,$2}' 100.2 23.45[root@centos7 05:13:40 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %3.2f",$1,$2}' 100.2 23.45[root@centos7 05:13:54 ~]#echo "100.23 23.45"|awk '{printf "%3.1f %3.1f",$1,$2}' 100.2 23.4[root@centos7 05:15:08 ~]# 例:[root@centos7 05:21:56 ~]#echo "a:d c:d;1:2 3" 【支持正則表達式 例:[ :]能夠以多個字符爲分割符】 a:d c:d;1:2 3 [root@centos7 05:22:29 ~]#echo "a:d c:d;1:2 3" |awk -v RS=";" -F "[: ]" '{print $1,$2}' a d 1 2 [root@centos7 05:23:12 ~]#echo "a:d c:d;1:2 3" |awk -v RS=";" -F "[: ]" '{print $1,$3}' a c 1 3
操做符tcp
算術操做符: x+y, x-y, x*y, x/y, x^y, x%y -x: 轉換爲負數 +x: 轉換爲數值 字符串操做符:沒有符號的操做符,字符串鏈接 賦值操做符: =, +=, -=, *=, /=, %=, ^= ++, -- 下面兩語句有何不一樣 • awk ‘BEGIN{i=0;print ++i,i}’ • awk ‘BEGIN{i=0;print i++,i}’ BECIN【在文件處理以前先執行一遍這樣的操做】 操做符 比較操做符: ==, !=, >, >=, <, <= 模式匹配符: ~:左邊是否和右邊匹配包含 !~:是否不匹配 示例: awk –F: '$0 ~ /root/{print $1}‘ /etc/passwd awk '$0~「^root"' /etc/passwd awk '$0 !~ /root/‘ /etc/passwd awk –F: ‘$3==0’ /etc/passwd 邏輯操做符:與&&,或||,非! 示例: • awk –F: '$3>=0 && $3<=1000 {print $1}' /etc/passwd • awk -F: '$3==0 || $3>=1000 {print $1}' /etc/passwd • awk -F: ‘!($3==0) {print $1}' /etc/passwd • awk -F: ‘!($3>=500) {print $3}’ /etc/passwd 函數調用: function_name(argu1, argu2, ...) 條件表達式(三目表達式): selector?if-true-expression:if-false-expression • 示例: awk -F: '{$3>=1000?usertype="Common User":usertype="Sysadmin or SysUser";printf "%15s:%-s\n",$1,usertype}' /etc/passwd
awk PATTERNide
PATTERN:根據pattern條件,過濾匹配的行,再作處理 (1)若是未指定:空模式,匹配每一行 (2) /regular expression/:僅處理可以模式匹配到的行,須要用/ /括起來 awk '/^UUID/{print $1}' /etc/fstab awk '!/^UUID/{print $1}' /etc/fstab (3) relational expression: 關係表達式,結果爲「真」纔會被處理 真:結果爲非0值,非空字符串 假:結果爲空字符串或0值 示例: awk -F: 'i=1;j=1{print i,j}' /etc/passwd awk ‘!0’ /etc/passwd ; awk ‘!1’ /etc/passwd Awk -F: '$3>=1000{print $1,$3}' /etc/passwd awk -F: '$3<1000{print $1,$3}' /etc/passwd awk -F: '$NF=="/bin/bash"{print $1,$NF}' /etc/passwd awk -F: '$NF ~ /bash$/{print $1,$NF}' /etc/passwd 4) line ranges:行範圍 startline,endline:/pat1/,/pat2/ 不支持直接給出數字格式 awk -F: ‘/^root\>/,/^nobody\>/{print $1}' /etc/passwd awk -F: ‘(NR>=10&&NR<=20){print NR,$1}' /etc/passwd 例:[root@centos7 17:49:46 ~]#awk 'NR>=1 && NR<=3 {print $0}' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@centos7 17:50:24 ~]#sed -n '1,3p' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin [root@centos7 17:55:59 ~]#awk '/^r/,/^d/' /etc/passwd [root@centos7 17:56:02 ~]#sed -n '/^r/,/^d/p' /etc/passwd (5) BEGIN/END模式 BEGIN{}: 僅在開始處理文件中的文本以前執行一次 END{}:僅在文本處理完成以後執行一次 示例 awk -F : 'BEGIN {print "USER USERID"} {print $1":"$3} END{print "end file"}' /etc/passwd awk -F : '{print "USER USERID「;print $1":"$3} END{print "end file"}' /etc/passwd awk -F: 'BEGIN{print " USER UID \n--------------- "}{print $1,$3}' /etc/passwd awk -F: 'BEGIN{print " USER UID \n--------------- "}{print $1,$3}'END{print "=============="} /etc/passwd seq 10 |awk ‘i=0’ seq 10 |awk ‘i=1’ seq 10 | awk 'i=!i‘ seq 10 | awk '{i=!i;print i}‘ seq 10 | awk ‘!(i=!i)’ seq 10 |awk -v i=1 'i=!i' 例:[root@centos7 17:14:48 ~]#df |awk -F "[ %]+" '/\/dev\/sda/{print $1,$5}' /dev/sda2 8 /dev/sda5 1 /dev/sda1 17 例:[root@centos7 17:45:09 ~]#awk -F: 'i=0{print $0}' /etc/passwd [root@centos7 17:45:22 ~]#awk -F: '!(i=0){print $0}' /etc/passwd root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
awk 控制語句函數
{ statements;… } 組合語句 if(condition) {statements;…} if(condition) {statements;…} else {statements;…} while(conditon) {statments;…} do {statements;…} while(condition) for(expr1;expr2;expr3) {statements;…} break continue delete array[index] delete array exit
awk控制語句 if-else
語法:if(condition){statement;…}[else statement] if(condition1){statement1}else if(condition2){statement2}else{statement3} 使用場景:對awk取得的整行或某個字段作條件判斷 示例: awk -F: '{if($3>=1000)print $1,$3}' /etc/passwd awk -F: '{if($NF=="/bin/bash") print $1}' /etc/passwd awk '{if(NF>5) print $0}' /etc/fstab awk -F: '{if($3>=1000) {printf "Common user: %s\n",$1} else {printf "root or Sysuser: %s\n",$1}}' /etc/passwd awk -F: '{if($3>=1000) printf "Common user: %s\n",$1; else printf "root or Sysuser: %s\n",$1}' /etc/passwd df -h|awk -F% '/^\/dev/{print $1}'|awk '$NF>=80{print $1,$5}‘ awk ‘BEGIN{ test=100;if(test>90){print 「very good「} else if(test>60){ print 」good」}else{print 「no pass」}} 例:[root@centos7 18:33:05 ~]#df |awk -F"[ %]+" '/^\/dev\/sda/{if($5>5) print $1,$5}' /dev/sda2 8 /dev/sda1 17 例:[root@centos7 18:42:52 ~]#cat access_log |awk '{print $1}' |sort |uniq -c |sort -nr|awk '{if ($1>80)print $0}' 44487 172.20.7.53 3000 172.20.112.38 2255 172.20.128.22 1206 172.20.130.5 407 172.20.129.234 220 172.20.129.246 210 192.168.32.7 195 172.20.120.185 100 172.20.32.7 例:[root@centos7 18:59:20 ~]#awk 'BEGIN{sum=0;i=1;while(i<=100){sum+=i;i++};print sum}' 5050
awk控制語句
while循環 語法:while(condition){statement;…} 條件「真」,進入循環;條件「假」,退出循環 使用場景: 對一行內的多個字段逐一相似處理時使用 對數組中的各元素逐一處理時使用 示例: awk '/^[[:space:]]*linux16/{i=1;while(i<=NF){print $i,length($i); i++}}' /etc/grub2.cfg awk ‘/^[[:space:]]*linux16/{i=1;while(i<=NF) {if(length($i)>=10) {print $i,length($i)}; i++}}’ /etc/grub2.cfg do-while循環 語法:do {statement;…}while(condition) 意義:不管真假,至少執行一次循環體 示例: awk 'BEGIN{ total=0;i=0;do{ total+=i;i++;}while(i<=100);print total}’ for循環 語法:for(expr1;expr2;expr3) {statement;…} 常見用法: for(variable assignment;condition;iteration process) {for-body} 特殊用法:可以遍歷數組中的元素 語法:for(var in array) {for-body} 示例: awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++) {print $i,length($i)}}' /etc/grub2.cfg
awk控制語句
switch語句 語法:switch(expression) {case VALUE1 or /REGEXP/: statement1; case VALUE2 or /REGEXP2/: statement2; ...; default: statementn} break和continue awk ‘BEGIN{sum=0;for(i=1;i<=100;i++) {if(i%2==0)continue;sum+=i}print sum}‘ awk ‘BEGIN{sum=0;for(i=1;i<=100;i++) {if(i==66)break;sum+=i}print sum}‘
awk數組
關聯數組:array[index-expression] index-expression: • (1) 可以使用任意字符串;字符串要使用雙引號括起來 • (2) 若是某數組元素事先不存在,在引用時,awk會自動建立此元素,並將其值 初始化爲「空串」 • (3) 若要判斷數組中是否存在某元素,要使用「index in array」格式進行遍歷 示例: weekdays[「mon」]="Monday「 awk 'BEGIN{weekdays["mon"]="Monday"; weekdays["tue"]="Tuesday";print weekdays["mon"]}‘ awk ‘!arr[$0]++’ dupfile awk '{!arr[$0]++;print $0, arr[$0]}' dupfile awk數組 若要遍歷數組中的每一個元素,要使用for循環 for(var in array) {for-body} 注意:var會遍歷array的每一個索引 示例: awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"] ="Tuesday";for(i in weekdays) {print weekdays[i]}}‘ netstat -tan | awk '/^tcp/{state[$NF]++}END {for(i in state) { print i,state[i]}}' awk '{ip[$1]++}END{for(i in ip) {print i,ip[i]}}' /var/log/httpd/access_log
awk函數
數值處理: rand():返回0和1之間一個隨機數 awk 'BEGIN{srand(); for (i=1;i<=10;i++)print int(rand()*100) }' 字符串處理: • length([s]):返回指定字符串的長度 • sub(r,s,[t]):對t字符串搜索r表示模式匹配的內容,並將第一個匹配內容替換爲s echo "2008:08:08 08:08:08" | awk 'sub(/:/,「-",$1)' • gsub(r,s,[t]):對t字符串進行搜索r表示的模式匹配的內容,並所有替換爲s所表 示的內容 echo "2008:08:08 08:08:08" | awk ‘gsub(/:/,「-",$0)' • split(s,array,[r]):以r爲分隔符,切割字符串s,並將切割後的結果保存至array所 表示的數組中,第一個索引值爲1,第二個索引值爲2,… netstat -tn | awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++} END{for (i in count) {print i,count[i]}}’ awk函數 自定義函數格式: function name ( parameter, parameter, ... ) { statements return expression } 示例: cat fun.awk function max(x,y) { x>y?var=x:var=y return var } BEGIN{a=3;b=2;print max(a,b)} awk –f fun.awk