统计一个文本中某个字符的个数

beyes · 发表于 2012-1-5 12:05:53

wc 命令可以统计一个文本中的总的字节个数。如果想统计一个文本中的某个字符的个数怎么办？

grep 命令的 -o 选项表示精确匹配，而且会将每个匹配的条件单独一行打印出来，如：

$ echo "hello world hello hell" > hello.txt
$ grep -o 'h' hello.txt
h
h
h

既然如此，我们只要统计出输出的行数即可，如我们要统计上面的 'h‘ 字符的个数，那么可以：

$ grep -o 'h' hello.txt |wc -l

第二种方法可以用 awk/gawk 来统计：

gawk -F "" '{for(i=1; i<=NF; i++) if($i=="h")++sum}END{print sum}' hello.txt

第三种方法还使用了 tr 命令，没有第一种方法简介：

cat hello.txt |tr -dc 'h' |wc -c
3

tr 命令中的 -d 选项表示删除掉匹配项，如果不用选项 -c 那么会得到输出：

ello world ello ell

如果用了 -c 选项(该选项是补足的之意)，也就是采用被删除的内容，因此会看到输出：

cat hello.txt |tr -dc 'h'
hhh

		自动登录	找回密码
密码			立即注册