曲径通幽论坛

 找回密码
 立即注册
搜索
查看: 3508|回复: 0
打印 上一主题 下一主题

awk 处理流程

[复制链接]

4918

主题

5880

帖子

3万

积分

GROAD

曲径通幽,安觅芳踪。

Rank: 6Rank: 6

积分
34397
跳转到指定楼层
楼主
发表于 2011-9-22 01:01:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
awk 程序由主输入(main input)循环组成。一个循环是一个例程,它将一直重复执行直到一些条件将它终止。比如下面有这么一个文本文件(test.txt):
320234902390
aaaaaabbbbbb
aaaa12345567
12345bbbbbbb
22a4a6a7b8b89
/*

这里有 4 个空行

*/
另外,我们还有一个写入一组命令的文件(awktest),内容如下:
[Bash shell] 纯文本查看 复制代码
/^$/ {print "This is a blank line."}
/[A-Za-z]+/ {print "This is a string."}
/[0-9]+/ {print "This is an integer"}

运行以下命令:
#awk -f awktest test.txt
This is an integer.
This is a string.
This is a string.
This is an integer.
This is a string.
This is an integer.
This is a string.
This is an integer.
This is a blank line.
This is a blank line.
This is a blank line.
This is a blank line.
awk 处理文本的过程如下:
首先,test.txt 中的文本是一行一行的输入到 awk 中,然后 awk 会试图依次使用 awktest 文件中列出的模式规则去测试输入的内容是否与其匹配,如果匹配,就执行后面的命令(print)。如果该行不匹配,则用下一行模式去测试,直到所有的模式测试完为止。

上面脚本中的正则表达式里的 '+' 号表示匹配前面的字符的一个或多个。另外,test.txt 中的后面 3 行里既含有数字又含有字母,这种情况下,它匹配了 2 行规则。比如在扫描 “12345bbbbbbb” 这一行时,/^$/ 规则是匹配空行的,所以不适用该行;接着使用 /[A-Za-z]+/ 规则去尝试匹配,这时扫描到后面的 bbbbbbb 时匹配成功,于是打印出“This is a string” ;再往下时,/[0-9]+/ 规则又匹配了该行的 12345 这部分,于是输出 “This is an integer.” 。所以对于一行输入来说,脚本文件中的所有规则都会去尝试是否匹配它。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|曲径通幽 ( 琼ICP备11001422号-1|公安备案:46900502000207 )

GMT+8, 2025-6-17 18:32 , Processed in 0.061111 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表