在“修正不同的URL地址表达”一文, 对于类别默认索引页面,我尚不能确定哪种形式的URL地址是最佳选择。今天,分析了不同的服务器上的不同的网站的LOG(日志)以后,可以确定,http://www.chinapromoter.com/english/b2b-list/index.htm,这种URL地址是最好的选择。
如何阅读网站的LOG(日志)
2008-07-24 12:44:08 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)
2008-07-24 12:44:08是YAHOO蜘蛛Slurp向服务器发出阅读请求的时间;
GET是获取目标页面所使用的数据传输方式;
获取的页面是目标域名下的/products/capacitor/Index.htm;
200 表示请求得到了响应,请求成功,并返回请求页面;
6824 是文件大小;
Slurp 是YAHOO 蜘蛛,后面附加的链接就是YAHOO 蜘蛛的说明页面。
HTTP/1.1 是文件传输使用的传输协议,有些网站日志会显示。
能够看懂网站日志就可以理解搜索引擎蜘蛛活动情况,统计搜索引擎蜘蛛每天来访的时间,停留了多久,喜欢抓哪种类型的页面。这样就可以调整网站内容更新的方式,比如搜索引擎蜘蛛喜欢抓取你网站下的二级栏目,那么在制作热门专题的时候就要在该二级栏目下制作,搜索引擎蜘蛛会先抓取先发布。对于搜索引擎蜘蛛不太喜欢的页面,就可以做上一些内链让搜索引擎蜘蛛顺着链接爬过去,这样搜索引擎蜘蛛就会逐渐的喜欢上所有的网站页面。
网站类别默认页面网址规范化处理
搜索引擎的链接分析体系以URL为单位,同时通过下面不同搜索引擎蜘蛛请求页面的不同记录,已经明确显示, 在类别默认页面网址的三种形式中,http://www.chinapromoter.com/english/b2b-list/index.htm, 这种形式是最理想的。特别是网站内部链接, 最好选择这种形式。
从以下记录显示,对于所有搜索引擎蜘蛛和一般访问者, “/目录” 这样的页面请求,返回一个301转向,而且通过长时间的跟踪观察,GOOGLE对经过一段时间的301转向以后,就不再检索“/目录” 这样的页面。“/目录/” 这样的页面请求,返回一个302转向。“/目录/index.htm” 这样的页面请求,返回一个成功的HTTP状态码。
YAHOO 蜘蛛
2008-07-19 17:40:36 W3SVC11 75.127.69.140 GET /wooden-toy - 80 - 74.6.22.170
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp) 301 0 0 393
2008-07-24 12:44:06 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/ - 302 319
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)
2008-07-24 12:44:08 74.6.22.169 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/5.0+(compatible;+Yahoo!+Slurp;+http://help.yahoo.com/help/us/ysearch/slurp)
GOOGLE 蜘蛛
2008-06-15 09:08:56 W3SVC11 75.127.69.140 GET /early-rider/baby-scooter - 80 - 66.249.65.173
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 301 0 0 406
2008-07-26 11:53:29 66.249.65.103 - 202.101.43.108 80 GET /products/trigger/ - 302 315
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)
2008-07-26 11:53:42 203.208.60.6 - 202.101.43.108 80 GET /products/trigger/Index.htm - 200 5785
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html)
2008-06-15 09:23:19 W3SVC11 75.127.69.140 GET /wooden-toy/dollhouse/*.htm - 80 - 66.249.65.173
Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 123 3105
一般访问者
2008-07-23 11:53:05 W3SVC9 75.127.69.140 GET /baby-bibs - 80 - 41.211.77.44
Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) 301 0 0 372
2008-07-24 08:04:22 87.189.244.196 - 202.101.43.108 80 GET /products/capacitor/ - 302 319
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322;+.NET+CLR+2.0.50727)
2008-07-24 08:04:22 87.189.244.196 - 202.101.43.108 80 GET /products/capacitor/Index.htm - 200 6824
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322;+.NET+CLR+2.0.50727)
2008-07-19 12:17:24 W3SVC11 75.127.69.140 GET /gift-promotion - 80 - 209.17.132.180
Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+.NET+CLR+1.1.4322) 301 0 0 374
网站首页网址规范化处理
很多时候其它网站会链接到
http://chinapromoter.com
http://www.chinapromoter.com/index.htm
http://chinapromoter.com/index.htm
而不是你希望的
这样链接的PR也会传递到所有URL,如果你用301转向把前三个URL转到http://www.chinapromoter.com
PR也就集中在网页http://www.chinapromoter.com。
搜索引擎对类别默认页面的处理
“/目录”作为301永久转向,“/目录/”作为302临时转向,“/目录/index.htm” 处理成功。对这3种情况,搜索引擎全部收录了我的网站的URL,貌似不会惩罚, 但对不同URL的权值有影响。