基本格式
awk '{commands}' filename
或者stdin | awk '{commands}'
以下,均简写为awk '{commands}'
的形式
commands的用法
commands逐行作用于文本流
- $1当前行第一列数据,$NF最后列,$(NF-1)即倒数第二列
awk '{print $(NF-1)}'
# 补充说明:
$0 当前行所有列
NR 当前行号
NF 当前行字段数
- print默认结尾换行;printf不换行
awk '{printf $1}'
- 多条语句以分号间隔
awk '{printf $1; print $(NF-1)}'
- 多个参数以逗号间隔,打印后以空格间隔
awk '{print $1, $2, $3}'
- 空格会被忽略不计
awk '{print $1 $2}'
打印结果这两个参数会被[字符拼接]
- 双引号拼接字符
awk '{print $1 ":" $2}'
打印结果是这两个参数用冒号连接
# 补充说明
外层的单引号也可以用双引号,
此时内层拼接用单引号
- 通过for循环打印范围列
awk '{for(i=9;i<NF;i++) printf $i"\t"; print ""}'
以分号制造了两个语句
1. 循环语句仅作用于紧跟着的打印语句
2. 循环完成后执行print语句换行
# 补充说明
如果for循环内有多条语句,必须使用大括号括起来:
awk '{
for(i=9;i<NF;i++){
printf $i; #此处分号不可以省略
print "\t"
}; #此处分号可以省略
print ""; #此处分号不可以省略
print ""
}'
- 通过条件判断执行打印
方法一: 条件操作语句(和for循环用法一致)
awk '{if($9>=100 && $10>=50)printf $9;print ""}'
使用多条语句:
awk '{
if($9>=100 && $10>=50){
printf $9;
printf "\t"$10
}
else if($9<100 && $10 >=50){
printf "$10"
}
else{
print "it\'s ok"
}
}'
方法二: 条件模式
awk自带三个条件模式:前面讲的所有均为中间的commands:
awk 'BEGIN {COMMANDS1} pattern {commands} END {COMMANDS2}'
实例:
awk '$9>=100||$10>=2{print $9"\t"$10}'
第九列值大于100且第十列值大于2时,打印这两个值
awk '!/CrowdApp/ && $9>=50 {print $9"\t"$10}'
包含CrowdApp字段,且第九个字段大于50时,打印xxx
awk 'NR==5,NR==10{print $0}'
打印5-10行的所有值
- BEGIN和END
awk 'BEGIN{ i=0 } /CrowdApp/ {print $0;i++} END{print $i}'
# 补充说明
BEGIN在执行awk所有命令前先执行一次;
patterns内的command每一行都会执行一次;
END只有在执行完所有语句后执行一次。
- awk参数传递
方法一:
awk -v var=$pwd '{print var}'
方法二:
awk '{print v1, v2}' v1=$VAR1, v2=$VAR2
- 指定字段分隔符
awk -F: '{print $NF}'
默认以空格分割各个字段;此时指定冒号分割