Linux笔试题之Awk语言题目实战(难度递增)
题目(多练多练多练多练,没有捷径)
-
只处理用户ID为奇数的行,并打印用户名和uid号
awk -F: '$3%2==1{print $1 $3}' /etc/passwd #关系表达式考察
-
显示系统的普通用户,并打印用户名和ID
awk -F: '$3>=1000{print $1 $3}' /etc/passwd #关系表达式考察
-
显示系统的普通用户,并打印用户名和ID
awk -F: '$7~/\/bin\/bash$/{print $1,$3}' /etc/passwd #~指的是 正则于
-
统计普通用户的个数
awk -F: '$3>=1000{++count}END{print count}' /etc/passwd #模式考察 awk -F: '$3>=1000{++count| "wc -l"}' /etc/passwd #模式考察
-
统计文本的总行数
END{ print NR} #num of record #模式考察还有记录内置变量NR
-
显示文件名
END{ print FILENAME} #不能在过程处理中输出
-
显示UID为1002用户的相关信息
awk -F: 'if($3==1002)system("id $1")' /etc/passwd #判断语句考察 awk -F: '$3==1002{print $0}' /etc/passwd #判断语句考察
-
利用awk模拟tail -l
END{ print $0} #输出整行
-
统计tcp的链接数
netstat -ant|awk '/^tcp/{++temp[$NF]}END{for (i in temp) print "temp[",i,"]=",temp[i]}' #NF :number of field,每一行最后一个字段数
-
分别统计不同ip的tcp连接
netstat -ant | awk '/^tcp/ { n=split($(NF-1),array,":"); #按照:划分,出现结果 两个字段和四个字段 两种情况 if(n<=2) ++S[array[(1)]]; else ++S[array[(4)]]; ++s[$NF];++N } END { for(a in S){ printf("%-20s %s\n", a, S[a]); #向左对齐占20个字节 ++I}c printf("%-20s %s\n","TOTAL_IP",I); for(a in s) printf("%-20s %s\n",a, s[a]); printf("%-20s %s\n","TOTAL_LINK",N); } '
-
合并两个文件的输出
```c
第一种解法: #FNR每次读取一个文件重新计数
awk 'NR==FNR{name[$1]=$2}NR!=FNR{$2=name[$1];print $0}‘ test2 test2
第二种解法:
merge.awk
{
if(NF==2){
temp1[$1]=$2
}
else if(NF==5){
temp2[$1]=$3
temp3[$1]=$4
temp4[$1]=$5
}
}
END{
for (i in temp1){
printf"%-5s%-6s%-4s%-4s%-4s\n ",i,temp1[i],temp2[i],temp3[i],temp4[i];
}
}
```
-
输出成绩表
[root@ ~/test 01:05:51]#cat test.awk BEGIN{ printf "LNO. Name No. Math Eng Com Total\n" printf "----------------------------------------\n" math=0;eng=0;com=0;total=0; } { math+=$3;eng+=$4;com+=$5;total+=$3+$4+$5; printf "%-7s%-7s%-5s%-6s%-5s%-5s%-5s\n", NR,$1,$2,$3,$4,$5,$3+$4+$5; } END{ printf "----------------------------------------\n" printf "%-19s%-6s%-5s%-5s%-5s\n", "Total:",math,eng,com,total; printf "%-19s%-6.1f%-5.1f%-5.1f%-5.1f\n","Avg:",math/NR,eng/NR,com/NR,total/NR; } [root@ ~/test 01:05:51]#awk -f test.awk test
-
某产品的CDN带宽运营成本迅猛增涨,其带宽主要由各种类型的图片组成,为了对某产品的图片流量带宽进行优化,现需要对该产品的图片和号码特性做一些分析,已有的日志文件test.log供分析使用,格式是:
号码|请求大小|请求id ---------------------------------- 001|100|abc.gif 002|80|abd.jpg 003|150|abe.gif 001|60|abf.gif 003|30|abg.jpg -----------------------------------
其中带有gif表示是gif图片的请求,带有jpg表示是jpg图片的请求,请使用(python/shell/awk/sort)编写程序实现如下分析思路(1,2为中间步骤,可以只输出3,4结果)
-
找出所有gif图片请求的所有号码
awk -F"|" '/gif$/{print $1 | "sort -u" }' test
-
找出所有gif图片请求的号码和其对应的请求大小总和及请求数总和.
awk -F"|" 'BEGIN{printf"no. c sum\n"}/gif$/{++req[$1];temp[$1]+=$2}END{for (i in temp){print i,req[i],temp[i]}}'
-
找出所有gif图片请求的号码,并按照其请求大小总和从大到小排序.
awk -F"|" 'BEGIN{printf"no. sum\n"}/gif$/{++req[$1];temp[$1]+=$2}END{for (i in temp){print i,temp[i]|"sort -k2 -nr"}}' test
-
找出所有gif图片请求的号码,并按其请求平均图片大小从大到小排序.
awk -F"|" 'BEGIN{printf"no. c sum avg\n"}/gif$/{++req[$1];temp[$1]+=$2}END{for (i in temp){print i,req[i],temp[i],temp[i]/req[i]|"sort -k4 -rn"}}' test
-