巧用Cygwin处理海量日志文件

2013-03-20
  • 1007
  • 0

在日常seo优化工作中,LOG文件分析必不可少,一般常用的日志分析程序有光年,金花等等.若要根据不同纬度,打造非标准化的分析报表时,这些工具就捉襟见肘了,通常情况下会使用到excel对日志文件进行非标准化处理,效果也非常良好.但是遇到百万行级别以上的日志文件,excel会出现打开缓慢,占用内存大等影响效率问题.如何进行常态化的非标准日志分析.是今天要讲的内容.

cygwin是一款windows平台上运行的linux模拟器.他可以通过强大的linux批处理命令对大型文件进行效率极高的处理,提高文件处理效率.

其中常用的命令有:

cat 读取文件 |awk 提取日志中不同类型| grep 查找字符串 | sort 排序 -fr 倒排 | uniq 去重 -c 计数| ls 计算文件行数

当然这些命令还支持正则匹配等功能.对于常态化的日志分析,可以讲命令模块化,每次只要复制粘贴就能获得自己想要的数据.节省花费在日志处理上的时间.