统计网站访问日志Shell脚本

作者: 聂扬帆博客 | 来源:发表于2017-05-17 15:46 被阅读55次

作为一个网站的管理员,web日志有很多信息值得去关注,但每天去查看海量的日志效率很低,于是写了个脚本来统计web日志,结合排程就可以每天定时发送到指定邮箱,方便管理员更直观的了解网站情况。
脚本统计了:
1、总访问量
2、总带宽
3、独立访客量
4、访问IP统计
5、访问url统计
6、来源页面统计
7、404统计
8、搜索引擎蜘蛛统计(谷歌,百度,搜狗)
9、搜索引擎来源统计(谷歌,谷歌HK,百度)

脚本中需要修改的变量:log_path、domain、email

#!/bin/bash
# @Date    : 2017-05-17
# @Author  : yangfannie
# @Name    : aoto_web_log.sh  --Automatic statistics website access log


log_path=/www/logs/yangfannie.com.log
domain="yangfannie.com"
email="admin@yangfannie.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk '{print $1}'`
total_bandwidth=`awk -v total=0 '{total+=$10}END{print total/1024/1024}' ${log_path}`
total_unique=`awk '{ip[$1]++}END{print asort(ip)}' ${log_path}`
ip_pv=`awk '{ip[$1]++}END{for (k in ip){print ip[k],k}}' ${log_path} | sort -rn | head -20`
url_num=`awk '{url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain '$11 !~ /http:\/\/[^/]*'"$domain"'/{url[$11]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
notfound=`awk '$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
spider=`awk -F'"' '$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++} $6 ~ /Sogou web spider/ {spider["sogouspider"]++}END{for (k in spider){print k,spider[k]}}'  ${log_path}`
search=`awk -F'"' '$4 ~ /https:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /https:\/\/www\.google\.com\.hk/ {search["googlehk_search"]++} $4 ~ /https:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}' ${log_path}`
echo -e "概况\n报告生成时间:${maketime}\n总访问量:${total_visit}\n总带宽:${total_bandwidth}M\n独立访客:${total_unique}\n\n访问IP统计\n${ip_pv}\n\n访问url统计\n${url_num}\n\n来源页面统计\n${referer}\n\n404统计\n${notfound}\n\n蜘蛛统计\n${spider}\n\n搜索引擎来源统计\n${search}" | mail -s "$domain $logdate log statistics" ${email}

博客地址:http://yangfannie.com

相关文章

  • 统计网站访问日志Shell脚本

    作为一个网站的管理员,web日志有很多信息值得去关注,但每天去查看海量的日志效率很低,于是写了个脚本来统计web日...

  • NGINX日志分析

    Nginx日志分析 日志记录: 1.统计日志中访问最多的10个IP(shell中管道越少运行越快) 2.统计日志中...

  • 19.实战 - 日志分析

    参考 利用Shell进行Web日志分析 nginx或者apache日志统计前十访问的URI Linux比赛 - 实...

  • Shell统计访问量

    昨天做了一个shell脚本,功能是统计车辆浏览日志文件中,单个车辆每月的浏览量。shell脚本以前也写过不少,间隔...

  • Python分析Apache日志

    这篇文章是Python拆分Apache日志,得到访问量、热门资源、出错比例、日志大小等统计信息。 一、统计网站...

  • 20171203题目列表

    Linux • shell统计日志中单接口访问量 mysql • Mysql是不支持嵌套事务的,开启了一个事务的情...

  • 网络分析shell脚本分享(实时流量、连接统计)

    一个强大的网络分析shell脚本分享(实时流量、连接统计)linux shell脚本之家http://www.jb...

  • 访问日志不记录静态文件、访问日志切割、静态元素过期时间

    访问日志不记录静态文件 访问日志切割 访问日志切割 日志需要写脚本按需求时间删除 静态元素过期时间 测试 扩展ap...

  • Nginx笔记

    nignx日志统计 1.根据访问IP统计UV 2.统计访问URL统计PV 3.查询访问最频繁的URL 4.查询访问...

  • 1.Shell脚本语言

    1.Shell介绍 shell是一种脚本语言,使用shell脚本可以访问操作系统的内核服务。 可以用于编译库。 s...

网友评论

  • 王一航:可以把需要修改的地方作为命令行参数传递进来😀

本文标题:统计网站访问日志Shell脚本

本文链接:https://www.haomeiwen.com/subject/cjmdxxtx.html