网站访问日志分析

查看日志代码如下:

2010-04-19 02:47:53 GET /index.html - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.baidu.com/s? 200 0 7990
2010-04-19 02:47:53 GET /images/bg.gif - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.wz0312.cn/ 200 0 403
2010-04-19 02:47:53 GET /images/tab.gif - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.wz0312.cn/ 200 0 571

日志解析:

以第一行为例:2010-04-19 02:47:53 GET /index.html - 121.19.86.133 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+.NET+CLR+2.0.50727) http://www.baidu.com/s? 200 0 7990
2010-04-19 02:47:53   日期和时间;
GET                   从服务器获取信息,一般为 GET或者POST;
/index.html           网站的首页;
121.19.86.133         请求客户端ip地址;
HTTP/1.1              文件传输协议1.1;
Mozilla/4.0+          表示使用的是与Netspace兼容的Mozilla浏览器;
compatible            适合的,兼用的;
MSIE6.0               微软公司出品的IE浏览器6.0版本;
Windows NT 5.1        微软公司出品的服务器操作系统;
SV1=Security Version 1   安全版本1;
http://www.baidu.com/s?  请求页面链接;
200                      表示返回OK状态;

附:一些常用代码含义

2xx----正常响应信息;

200(成功) 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。如果针对您的 
    robots.txt 文件显示此状态代码,则表示搜索引擎已成功检索到该文件。
201(已创建) 请求成功并且服务器创建了新的资源。
202(已接受) 服务器已接受请求,但尚未处理。
203(非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。
204 响应不同,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)。
205(重置内容) 服务器成功处理了请求,但没有返回任何内容。
206(部分内容) 服务器成功处理了部分 GET 请求;

3xx----URL重定向信息;

300(多种选择) 针对请求,服务器可执行多种操作。服务器可根据请求者(user agent)选 择一项操
   作,或提供操作列表供请求者选择。
301(永久移动) 请求的网页已永久移动到新位置。服务器返回此响应(对GET或HEAD请 求的响应)
   时,会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网 页或网站已永久移动
   到新位置。
302(临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进 行以后
   的请求。此代码与响应GET或HEAD请求的301代码类似,会自动将请求者 转 到不同的位置,但您
   不应使用此代码来告诉 Googlebot 某个网页或网站已经移动, 因为 Googlebot 会继续抓取原
   有位置并编制索引。
303(查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器 返回此
   代码。对于除HEAD之外的所有请求,服务器会自动转到其他位置。
304(未修改) 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网 页内容。
305(使用代理) 请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请 求者应使
   用代理。
307(临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来 进行以
   后的请求。此代码与响应 GET 和 HEAD 请求的 301 代码类似,会自动将请求 者转到不同的位
   置,但您不应使用此代码来告诉 Googlebot 某个页面或网站已经移动, 因为 Googlebot 会继
   续抓取原有位置并编制索引。

4xx----暂时性错误,客户端错误;

400(错误请求) 服务器不理解请求的语法。
401(未授权) 请求要求身份验证。对于需要登录的网页,服务器可能返回此响应;
403(禁止) 服务器拒绝请求。如果您在 Googlebot 尝试抓取您网站上的有效网页时看到此 状态代
   码(可以在Google网站管理员工具诊断下的网络抓取页面上看到此信息),可能 是您的服务器或
   主机拒绝 Googlebot 访问。
404(未找到) 服务器找不到请求的网页。例如,对于服务器上不存在的网页经常会返回此 代码。

5xx----永久性错误,没有权限时会提示;

500(服务器内部错误) 服务器遇到错误,无法完成请求。
501(尚未实施) 服务器不具备完成请求的功能。
相关文章
相关标签/搜索