曲径通幽论坛

标题: RS 记录分隔符 [打印本页]

作者: beyes    时间: 2012-2-24 18:24
标题: RS 记录分隔符
RS 的全称是 Record Separator,是记录分隔符之意,它也是一个内置变量。

一般情况下,一条记录就是一行,这里默认的记录分隔符就是一个换行符(\n) 。但是有些记录并不是一行一条,而是有其它形式。如下面这个文本:
$ cat rs.txt
beyes
groad.net
10
20

(两个换行)

admin
baidu.com
30
40

(两个换行)

tony
sina.com.cn
29
69

(两个换行)

linus
kernel.org
100
98
这里,我们打算将类似于
beyes
groad.net
10
20
这样的一个数据块作为一条记录。那么整个文本中就有了 4 条这样的记录。每条记录由两个空行分割,即两个换行符(\n\n) 。这里,这两个换行符就是记录的分隔符,即 RS 的值。

下面的命令,我们希望打印出每条记录中的头两行,而且这两行必须在输出结果中的同一行上,如:
beyes groad.net
admin baidu.com

运行如下命令:
$ awk 'BEGIN { RS="\n\n"; FS="\n"; }
> { print $1, $2; }
> END {print "End of processed"}' rs.txt
beyes groad.net
admin baidu.com
tony sina.com.cn
linus kernel.org
End of processed
在上面的命令中,指定了 RS 的值为两个换行符,FS 的值为一个换行符。对于一条记录来说,它由多行组成,因此它的一个明显的域分隔符(FS)就是一个换行符(\n) 。




欢迎光临 曲径通幽论坛 (http://www.groad.net/bbs/) Powered by Discuz! X3.2