Chinapromoter Blog

生活, 艺术, 网络, 技术, 工业, 消费, 记录趣味生活的点点滴滴。

« 认识HTTP状态码(HTTP Status Codes)Capacitor网站类别默认索引页面的链接调整 »

通过网站日志确定最佳网址规范

在“修正不同的URL地址表达”一文, 对于类别默认索引页面,我尚不能确定哪种形式的URL地址是最佳选择。今天,分析了不同的服务器上的不同的网站的LOG(日志)以后,可以确定,http://www.chinapromoter.com/english/b2b-list/index.htm,这种URL地址是最好的选择。

如何阅读网站的LOG(日志)

2008-07-24 12:44:08 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)

2008-07-24 12:44:08是YAHOO蜘蛛Slurp向服务器发出阅读请求的时间;
GET是获取目标页面所使用的数据传输方式;
获取的页面是目标域名下的/products/capacitor/Index.htm;
200 表示请求得到了响应,请求成功,并返回请求页面;
6824 是文件大小;
Slurp 是YAHOO 蜘蛛,后面附加的链接就是YAHOO 蜘蛛的说明页面。

HTTP/1.1 是文件传输使用的传输协议,有些网站日志会显示。

能够看懂网站日志就可以理解搜索引擎蜘蛛活动情况,统计搜索引擎蜘蛛每天来访的时间,停留了多久,喜欢抓哪种类型的页面。这样就可以调整网站内容更新的方式,比如搜索引擎蜘蛛喜欢抓取你网站下的二级栏目,那么在制作热门专题的时候就要在该二级栏目下制作,搜索引擎蜘蛛会先抓取先发布。对于搜索引擎蜘蛛不太喜欢的页面,就可以做上一些内链让搜索引擎蜘蛛顺着链接爬过去,这样搜索引擎蜘蛛就会逐渐的喜欢上所有的网站页面。

网站类别默认页面网址规范化处理

搜索引擎的链接分析体系以URL为单位,同时通过下面不同搜索引擎蜘蛛请求页面的不同记录,已经明确显示, 在类别默认页面网址的三种形式中,http://www.chinapromoter.com/english/b2b-list/index.htm, 这种形式是最理想的。特别是网站内部链接, 最好选择这种形式。

从以下记录显示,对于所有搜索引擎蜘蛛和一般访问者, “/目录” 这样的页面请求,返回一个301转向,而且通过长时间的跟踪观察,GOOGLE对经过一段时间的301转向以后,就不再检索“/目录” 这样的页面。“/目录/” 这样的页面请求,返回一个302转向。“/目录/index.htm” 这样的页面请求,返回一个成功的HTTP状态码。

YAHOO 蜘蛛

2008-07-19 17:40:36 W3SVC11 75.127.69.140 GET /wooden-toy - 80 - 74.6.22.170
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp) 301 0 0 393

2008-07-24 12:44:06 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/ - 302 319
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)

2008-07-24 12:44:08 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)

GOOGLE 蜘蛛

2008-06-15 09:08:56 W3SVC11 75.127.69.140 GET /early-rider/baby-scooter - 80 - 66.249.65.173
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 301 0 0 406

2008-07-26 11:53:29 66.249.65.103 - 202.101.43.108 80 GET /products/trigger/ - 302 315
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)

2008-07-26 11:53:42 203.208.60.6 - 202.101.43.108 80 GET /products/trigger/Index.htm - 200 5785
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)

2008-06-15 09:23:19 W3SVC11 75.127.69.140 GET /wooden-toy/dollhouse/*.htm - 80 - 66.249.65.173
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 123 3105

一般访问者

2008-07-23 11:53:05 W3SVC9 75.127.69.140 GET /baby-bibs - 80 - 41.211.77.44
Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) 301 0 0 372

2008-07-24 08:04:22 87.189.244.196 - 202.101.43.108 80 GET /products/capacitor/ - 302 319
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322;+.NET+CLR+2.0.50727)

2008-07-24 08:04:22 87.189.244.196 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322;+.NET+CLR+2.0.50727)

2008-07-19 12:17:24 W3SVC11 75.127.69.140 GET /gift-promotion - 80 - 209.17.132.180
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322) 301 0 0 374

网站首页网址规范化处理

很多时候其它网站会链接到

http://chinapromoter.com
http://www.chinapromoter.com/index.htm
http://chinapromoter.com/index.htm

而不是你希望的

http://www.chinapromoter.com

这样链接的PR也会传递到所有URL,如果你用301转向把前三个URL转到http://www.chinapromoter.com
PR也就集中在网页http://www.chinapromoter.com


搜索引擎对类别默认页面的处理

“/目录”作为301永久转向,“/目录/”作为302临时转向,“/目录/index.htm” 处理成功。对这3种情况,搜索引擎全部收录了我的网站的URL,貌似不会惩罚, 但对不同URL的权值有影响。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表


Powered By Z-Blog 1.8 Spirit Build 80605

Copyright www.chinapromoter.cn. Some Rights Reserved. 浙ICP备05022498号