记得在昨天,笔者在通过CNZZ统计查看一个来自百度的新关键字时,这个网站是使用WordPress制作的企业网站,其编码为UTF-8,在百度的搜索页面中其URL中的汉字显示的是乱码.这种现象在以往一直存在,网民在使用据称最懂中文的搜索引擎百度,看到很多奇怪的莫名其妙的字符,如星剑(starow)就曾经说过,UTF-8编码的网站,URL中的百度会变成鐧惧害 ,而Google一开始也不能识别gb2312和GBK编码URL中的汉字, 不知道早些时候何时修改了. 请看图片:
以下为引用的内容:
就在今天4月8日,我习惯性地site:www.wysth.com ,发现百度竟然可以识别带汉字的UTF-8编码URL,我昨天刚刚升级了一个WordPress的图片插件,以为是网站程序更改了,又site了我例外一个使用phpcms UTF-8编码的茶叶网站(www.lincha.com)和Discuz构建的论坛(),确认百度可识别带汉字的utf-8编码URL了.请看图片:
以下为引用的内容:
site: 的结果:
tag 的结果:
网站编码和URL已经是SEO的重要因素之一.关于网站用utf-8编码还是用gbk编码或gb2312编码好,这个问题在各大CMS开发论坛及各大站长论坛的讨论颇多,大多站长普遍认为涉外网站(如外贸英文网站)使用UTF-8编码,主要针对国内访客的网站使用gbk或gb2312的编码.国内几大网站都是使用gb2312编码,就连百度,Sina,Sohu,网易163几大门户也是如此。
百度从一开始就不支持识别带汉字的utf-8编码URL,已经存在好几年的时间,为何数年不解决这个bug,应该不是技术问题,也许是百度为了提高用户体验满意度,也许百度根本就不曾关心过这个细微的问题,也许是在Google支持gb编码URL后跟进的, 竞争促进进步,垄断扼杀创新。