网站日志是站长们会接触到的一项数据,一般不会作为网站分析的主要数据来源,但我们可以通过网站日志了解到用户的行为和解析用户的浏览目的。本文狂人SEO跟大家讲下网站日志是什么?网站日志分析了什么内容?
一、网站日志格式分类
目前常见的网站日志格式主要有两类:
1、Apache的NCSA日志格式:NCSA格式又分为NCSA普通日志格式(CLF)和NCSA扩展日志格式(ECLF)两类,目前最常用的是NCSA扩展日志格式及基于自定义类型的Apache日志格式。
2、IIS的W3C日志格式:W3C扩展日志格式(ExLF)具备了更为丰富的输出信息,主要是微软IIS(Internet Information Services)中应用。
二、网站日志是什么
网站日志(Web log)是一种记录网站服务器与用户之间交互行为的文件。当用户访问网站时,服务器会自动将用户的访问信息写入日志文件中。网站日志主要包括访问日志、错误日志和其他类型的日志。这些日志文件有助于网站管理员分析网站的运行状况,监测服务器性能,诊断问题,分析用户行为等。
网站日志通常包含以下信息:
1、IP地址:用户的IP地址,用于识别访问者的地理位置和网络服务商。
2、访问时间:用户访问网站的日期和时间。
3、请求方法:用户使用的HTTP方法,如GET、POST等。
4、请求资源:用户请求的网页或资源的URL地址。
5、HTTP状态码:服务器返回给访问者的HTTP响应状态码,如200表示请求成功,404是请求资源未找到等。
6、用户代理:访问者使用的浏览器和操作系统的信息,有助于了解访问者的设备和浏览习惯。
7、来源页面:用户从哪个页面跳转至当前页面的URL地址,有助于了解网站的内部链接和外部来源。
8、数据传输量:用户请求的资源大小,用于统计网站的流量消耗。
三、典型的网站日志文件
网站日志数据的优势在于不需要安装跟踪代码,只要你的网站上线,即网站代码在服务器运行时,它就会开始记录数据。用户访问你网站触发的任何行为,网站日志都会一一记录,比如当用户访问你网站一个页面,这时你的网站日志就会记录一行。当同一个用户访问网站上的另一个页面或图像,网站日志又会记录另一行。
下图是一个典型的网站日志记录。用户使用IP:82.168.22.10成功访问了网站首页(/)(即HTTP的返回码是200)、流量来源是谷歌搜索、用户使用的是火狐浏览器。
四、网站日志文件的缺点
从网站日志中获得的数据并不是完整的,很多网站使用的是JavaScript等代码来实现用户在网站上的交互行为,但网站日志不能记录这些由JavaScript代码产生的交互行为,所以会缺失一部分用户数据。一些流量数据统计分析工具可以跟踪JavaScript的交互行为。
当你的网站有网站静态的缓存文件时,文件缓存机制将只会返回用户的缓存文件。例如,图像文件、CSS文件、JavaScript文件等文件类型适用于文件缓存机制。所以,当你的网站日志返回用户缓存文件时,将不会被记录到网站日志中。
当网站每天的访问数超过100,000时将会生成一个至少30G的网站日志文件,那一个月就会累计1TB的原始数据。从如此大的原始数据中提取分析出人们易懂的日常报表是非常困难而且非常耗时的,而且还占用了很多宝贵的储存资源。
标签: SEO入门教程
还木有评论哦,快来抢沙发吧~