WEB日志的一般性分析
转自:http://www.sunnyu.com/?p=8
随着网站正式运行,我们可以通过通用的免费日志分析工具比如awstats获得一些实际访问网站的信息,例如每天ip量,pv量,用户所用的的浏览器,用户所用的操作系统等,但是有时候希望通过手工方式从WEB日志文件中获得一些信息,下面列出了一些最近一段时间我经常在用的命令
获得访问前10位的ip地址
列出输出大于200000byte(约200kb)的页面以及对应页面发生次数
列出最最耗时的页面(超过60秒的)的以及对应页面发生次数cat www.access.log |awk '($NF > 30){print $7}'|sort -n|uniq -c