网站的URL是搜索引擎索引和抓取内容的的一把钥匙,也是唯一的入口,对于网址的合理处理可以增加收录数量。由于网站使用的开发语言各不相同,也会产生各种奇形怪状的URL。
比如长度很长,URL中带有很多连词符号(-)、&、%、井号,URL中直接使用中文汉字作为URL的一部分等,这些都是不规范、不友好的URL,会给搜索引擎索引页面时增加难度。
网站URL优化是每一个网站必须进行的一个步骤,一般情况下我们习惯称之为URL标准化,好的网址对搜索引擎是有帮助的,常见的方法是使用URL重写的方式来达到优化的目的。
几乎所有的搜索引擎在URL优化上都建议使用静态或伪静态的方式,也就是使用rewrite方法将动态网址处理成伪静态的方式,那么是不是只要使用了URL重写就算真正的对搜索引擎友好了呢?
答案是否定的,因为有些URL重写规则本身就有问题,比如这个网址/seo/df-r-y-00-12-h/%hfgh/%hf/2.html,虽然已经是伪静态了,但是可以很直观的看出目录层级太多,特殊符号太多。即使是伪静态,这样的网址也是不规范的伪静态。
所以想要是URL对搜索引擎友好,不仅要做好URL重写,还应该做好规范的伪静态,具体应该这样来优化网站的URL。
一般情况下,一个网站应该有清晰的目录结构,栏目列表首页→栏目1,首页→栏目1→栏目2,如下图所示,网站的分类栏目是层次清楚的,在重写URL时也应该按照这样的层级关系来处理。
URL栏目层级优化
栏目页应该这样去做优化:
/lanmu1/
/lanmu1/lanmu2/
/lanmu1/lanmu2/lanmu3/
每一级栏目都清晰明了,在做栏目优化时最后要加上斜杠,URL目录最大保持在3层目录,网址目录层级太多不利于SEO优化,这样会减少搜索引擎对服务器的请求,网址最后的斜杠有指向具体文件的意思。
不知道从什么时候起,有人鼓吹在URL中出现关键词有利于排名的提升,作用会有那么一丁点,实际上是一种误导。
在URL中不要使用特殊符号,因为你不确定某个特殊符号是否会造成收录失败,比如URL中的井号,搜索引擎在遇到网址中的井号时就会直接截断井号后面的内容不予理会。而特殊符号也会增加解析URL的难度,正确的做法是URL只用字母和数字,尽量少用或不使用下划线、连词符号、及中文。
中文出现在网址中,搜索引擎在识别URL时会进行二次转码识别,优势难免会出现识别不了的情况,所以那些用中文关键词作为URL一部分的是完全不规范的,而且对排名没有什么提升效果。
网址太长了搜索引擎抓取也会比较费劲,不是抓取不了,而是增加了搜索引擎识别的难度。对浏览器来说网址有多长都没有关系,但是搜索引擎不行,想要收录好就不要把URL弄得很长。URL长度的计算方法是除去协议“http(s)://”后剩下的全部符号及字符数量,按照网站的编码,utf8占3个字节,gbk占2个字符,可以自行计算一下是否超出了长度。
有人喜欢把详情页的URL制作成栏目的方式,比/asd/2.html则把网址写成/asd/2这样的方式,原因是栏目页的权重会比详情页更高,为了提高详情页的权重所以这样做。这种做法也是不对的,详情页就应该明确地指出具体的文件名,这样搜索引擎就不用再去查找了。详情页使用URL重写后应该以.html结尾,指明这是一个静态文件,而不是让搜索引擎还有在去查找一番。
所以栏目页要记得在最后加上斜杠,不如“/seo/felei1”这个栏目页正确的写法是“/seo/felei1/”,详情页/lm/a.html这样才算正确。
总之在优化URL时可以统一一个规则,不要想当然的随便优化,优化不当可能会导致收录不好,最保险的方法就是使用字母,数字,不使用特殊符号。