曲径通幽论坛

标题: 统计单列数据总数 [打印本页]

作者: beyes    时间: 2012-6-1 16:27
标题: 统计单列数据总数
今天看了一下盛大的 CDN 加速流量统计,一天下来差不多已达到 1G ,有点吃惊,登录盛大的云分发控制台看下报表,只见它是每 5 分钟统计一次流量,而且都是小小几M不等,但报表上并没有统计这些流量的总数,怀疑这些流量加起来真的有这么多么?
[attach]540[/attach]

于是就想自己算了一下。

首先将网页源码另存为文件,看一下相关流量的 HTML 代码表示,规律如下:
[attach]541[/attach]
格式很简单,只需要去掉 HTML 代码和 "MB” 字样后,统计总数即可,使用如下命令:
[root@beyes   cdn]# grep "MB" ./user.php.htm | sed 's/<[^>]*>//g' |sed 's/MB//g' |awk 'BEGIN { total = 0; } {total += $1} END {print total}'
984.02
上面使用了 awk 来统计单列数据的累加,这里只有 1 列,即 $1 。需要注意的是,awk 也是逐行的处理的,因此 total += $1 能够实现累加的功能。


确实这么多,可见盛大确实没有坑人。




欢迎光临 曲径通幽论坛 (http://www.groad.net/bbs/) Powered by Discuz! X3.2