一、AWK操作符:

1、给域命名。 给域取一个有意义的名字,更利于记忆。

tom@svr:~/ssh$ awk '{name=$1;belts=$4;if(belts ~/Yellow/) print name" is belt "

belts }' grade.txt

P.Bunny is belt Yellow

注意点:a 用分号分隔不同的定义语句; b 变量可以直接输出,但原样输出的字符串则必须用引号。

 

tom@svr:~/ssh$ awk '{

name=$1;belts=$4 if(belts ~/Yellow/) print name "is belt " blets }' grade.txt

awk: line 1: syntax error at or near if  缺少分号

 

 

2、修改数据域的取值。

修改M.Tansley的目前级别分域,使其数值从40减为39

 awk '{name=$1;score=$6; if(name~/M.Tansley/) score=score-1; print name "\t" score}' grade.txt

会输出其他的行

tom@svr:~/ssh$ awk '{name=$1;score=$6; if(name=="M.Tansley") {score=score-1; print name "\t" score} } ' grade.txt

M.Tansley       39

tom@svr:~/ssh$

只会输出当前行。区别:后者将score1和打印动作框起来作为if模式的动作;而前者中只有score1if模式的动作,打印动作属于缺省动作。

 

3、只显示修改的记录。

tom@svr:~/ssh$ awk '{name=$1;score=$6; if(name=="M.Tansley") {score=score-1; print name "\t" score} } ' grade.txt

M.Tansley       39

tom@svr:~/ssh$

 

4、新增列

tom@svr:~/ssh$ awk 'BEGIN {print "Name    Difference\n--------------------------"} {if($6<$7) {dif=$7-$6; print $1,dif} }' grade.txt

Name    Difference

--------------------------

M.Tansley 4

J.Lulu 2

tom@svr:~/ssh$

注意与 awk 'BEGIN {print "Name    Difference\n--------------------------"} {if($6<$7) dif=$7-$6; print $1,dif }' grade.txt 的区别。dif赋值只在$6<$7满足的前提下执行,而print则为缺省执行。

 

二、AWK内置的字符串函数

1)gsub        查找与替换,相当于sed

格式gsub(/目标模式//替换模式/,范围) 第三个参数可以省略,若省略则表示在$0范围内查找与替换。

例:将学号为4842的字段替换成4800.

tom@svr:~/ssh$ awk 'gsub(/4842/,4800) {print $0}' grade.txt

J.Troll         07/99   4800    Brow-3  12      26      26

tom@svr:~/ssh$

 

2)length     返回长度

例:在末尾返回名字域的字符串长度。

tom@svr:~/ssh$ awk '{len=length($1); {print $0,len}}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44 9

J.Lulu          06/99   48317   green   9       24      26 6

P.Bunny         02/99   48      Yellow  12      35      28 7

J.Troll         07/99   4842    Brow-3  12      26      26 7

L.Tansley       05/99   4712    Brow-3  12      30      28 9

tom@svr:~/ssh$

 

3)index      返回目标字符串的第一位置

例:返回字符串P.Bunny中第一个出现ny的位置。

tom@svr:~/ssh$ awk 'BEGIN {ind=index("P.Bunny","ny"); print ind} ' grade.txt

6

tom@svr:~/ssh$

 

4)match    是否包含目标字符

例子1 name域中含有L字母的行。

tom@svr:~/ssh$ awk '{name=$1; if(match(name,/L/)) {print $0} }' grade.txt

J.Lulu          06/99   48317   green   9       24      26

L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$

例子2name域中L字母打头的行。

tom@svr:~/ssh$ awk '{name=$1; if(match(name,/^L/)) {print $0} }' grade.txt

L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$

例子3name域中L出现的次数为1或者多次的行。

tom@svr:~/ssh$ awk '{name=$1; if(match(name,/L+/)) {print $0} }' grade.txt

J.Lulu          06/99   48317   green   9       24      26

L.Tansley       05/99   4712    Brow-3  12      30      28

 

 

5)split        将源字符用分隔符分成字符数组

第一个参数:指定被分割的字符串

第二个参数:指定数组名

第三个参数:指定分割符,必须用双引号例如"." ,"-" ,"/"

tom@svr:~/ssh$ awk '{print split($4,myarr,"-")}' grade.txt

1

1

1

2

2

tom@svr:~/ssh$

 

6)sprint     格式输出

 

 

7)sub        发现并替换模式的第一次出现位置

例:

tom@svr:~/ssh$ awk '{print $0}' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

P.Bunny         02/99   48      Yellow  12      35      28

J.Troll         07/99   4842    Brow-3  12      26      26

L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$ awk '{name=$1;if(name=="J.Troll")sub(/26/,50,$0); print $0 }' grade.txt

M.Tansley       05/99   48311   Green   8       40      44

J.Lulu          06/99   48317   green   9       24      26

P.Bunny         02/99   48      Yellow  12      35      28

J.Troll         07/99   4842    Brow-3  12      50      26

L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$

 

 

8)substr   截取字符串,得到子串

例:

tom@svr:~/ssh$ awk '{fullname=$1;firstName=substr(fullname,3,99); print firstName "\t" $0}' grade.txt

Tansley M.Tansley       05/99   48311   Green   8       40      44

Lulu    J.Lulu          06/99   48317   green   9       24      26

Bunny   P.Bunny         02/99   48      Yellow  12      35      28

Troll   J.Troll         07/99   4842    Brow-3  12      26      26

Tansley L.Tansley       05/99   4712    Brow-3  12      30      28

tom@svr:~/ssh$

 

awk -F[:] '{print $1,$3,$4}' /etc/passwd 

使用特殊域分割符。