曲径通幽论坛

标题: 统计一个文本中某个字符的个数 [打印本页]

作者: beyes    时间: 2012-1-5 12:05
标题: 统计一个文本中某个字符的个数
wc 命令可以统计一个文本中的总的字节个数。如果想统计一个文本中的某个字符的个数怎么办?

grep 命令的 -o 选项表示精确匹配,而且会将每个匹配的条件单独一行打印出来,如:
$ echo "hello world hello hell" > hello.txt
$ grep -o 'h' hello.txt
h
h
h
既然如此,我们只要统计出输出的行数即可,如我们要统计上面的 'h‘ 字符的个数,那么可以:
$ grep -o 'h' hello.txt |wc -l

第二种方法可以用 awk/gawk 来统计:
gawk -F "" '{for(i=1; i<=NF; i++) if($i=="h")++sum}END{print sum}' hello.txt

第三种方法还使用了 tr 命令,没有第一种方法简介:
cat hello.txt |tr -dc 'h' |wc -c
3
tr 命令中的 -d 选项表示删除掉匹配项,如果不用选项 -c 那么会得到输出:
ello world ello ell
如果用了 -c 选项(该选项是补足的之意),也就是采用被删除的内容,因此会看到输出:
cat hello.txt |tr -dc 'h'
hhh





欢迎光临 曲径通幽论坛 (http://www.groad.net/bbs/) Powered by Discuz! X3.2