由于网站内容的不断变化,一些过去Google搜录的页面无法显示了,为了不至于损失这部分流量,我很早就做了404状态的自定义页面。这样,客户打开任何一个不存在的页面返回也带有指引的页面,比如,这个不存在的页面 http://www.mylovebb.com/Noexsit/ 显示了我的自定义页面,而真实的自定义页面在 http://www.mylovebb.com/404/404.htm
但今天在Google网站管理工具中验证网站所有权时,才发现我的网站如果采用上传文件html方式,就无法通过验证,原因是google认为我网站不存在的页面都返回200状态,上网查询一下,这才意识到,可能这样的方式不利于网站的SEO,于是在网上猛查资料,如何在自定义美化的同时,又能返回404状态。查了很多页面,都是叙述如何影响优化,可就是没有一个办法如何返回404状态,特别是针对自定义的htm文件,测试很久,终于解决:不要在自定义中使用url,而要采用"文件“的方式。修改后,Google也成功验证了网站上传的htm文件,说明它也承认我修正了这个问题,IIS日志已经清楚表明了确实是返回了404状态:
2007-12-16 15:32:33 W3SVC2072503878 121.14.136.88 GET /Noexsit/ - 80 - 222.248.83.87 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1;+POTU(RR:27120522:0:5189122);+.NET+CLR+2.0.50727;+.NET+CLR+1.1.4322) 404 0 2
不过说到这个问题,我的网站还有一个地方需要改进,那就是一些静态页面和动态页面共存,比如产品的详细页面有静态页面、有假静态页面,有动态页面,原来傻傻的认为这样可能增加了收录范围,但可能Google会认为我的网站充斥重复的内容。但如何解决这个问题,还真有些不好办,除非所有的链接改用静态地址,不用动态地址,但这个问题如要修正,又得花去多少时间啊?! 难怪LP说我像一尊佛,整体都在电脑上忙,也不知道我忙啥,也看我们没忙出什么结果出来,她哪里明白,技术这个东西就是没完没了的改......夜深了,先不管它吧,今天今天我知道自己还算没有白过。