曲径通幽论坛

 找回密码
 立即注册
搜索
查看: 8537|回复: 0
打印 上一主题 下一主题

统计一个文本中某个字符的个数

[复制链接]

4917

主题

5879

帖子

3万

积分

GROAD

曲径通幽,安觅芳踪。

Rank: 6Rank: 6

积分
34382
跳转到指定楼层
楼主
发表于 2012-1-5 12:05:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
wc 命令可以统计一个文本中的总的字节个数。如果想统计一个文本中的某个字符的个数怎么办?

grep 命令的 -o 选项表示精确匹配,而且会将每个匹配的条件单独一行打印出来,如:
$ echo "hello world hello hell" > hello.txt
$ grep -o 'h' hello.txt
h
h
h
既然如此,我们只要统计出输出的行数即可,如我们要统计上面的 'h‘ 字符的个数,那么可以:
$ grep -o 'h' hello.txt |wc -l

第二种方法可以用 awk/gawk 来统计:
gawk -F "" '{for(i=1; i<=NF; i++) if($i=="h")++sum}END{print sum}' hello.txt

第三种方法还使用了 tr 命令,没有第一种方法简介:
cat hello.txt |tr -dc 'h' |wc -c
3
tr 命令中的 -d 选项表示删除掉匹配项,如果不用选项 -c 那么会得到输出:
ello world ello ell
如果用了 -c 选项(该选项是补足的之意),也就是采用被删除的内容,因此会看到输出:
cat hello.txt |tr -dc 'h'
hhh
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|曲径通幽 ( 琼ICP备11001422号-1|公安备案:46900502000207 )

GMT+8, 2024-5-14 07:56 , Processed in 0.060637 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表