我们在优化网站的时候都会遇到页面的相识度,页面的相识度指的是网站页面与页面的相识度。搜索引擎在抓取页面的时候,通常都会对页面就行比较,如果一个页面的相识度达到80%以上搜索引擎就会认为是垃圾内容,就不会给予收录,在70%到80%之间的搜索引擎会收录,但是给予的权重不高;
搜索引擎在判断价相识度高度的同时会采用两种算法,一种叫做MD5的算法,如果摘要太过于相识就会认为是抄袭;另外一种就是关键词的出现程度,搜索引擎在判断页面内容是否是高价值的时候会吧你网站上面所出现的文字进行组合,组合成可以匹配的关键词,在用这些关键词去搜索引擎的数据库里面进行匹配,如果大部分的关键词都在同一另个网站页面上的时候,就证明你的这个页面是垃圾页面。
网站页面的布局都是导航、页面的边栏、底部跟主要区域,不同的就是样式、代码跟内容,所以我们最主要的就是解决这三个个问题,不懂代码的只要解决内容就可以了。
页面的相识度也可以不是在同一个网站上面的页面。很多人建网站都是用一些开源的程序,然后在寻找一个适合自己行业的模板,但是这些模板都是有很多人在用了的,我们在去用就会产生跟其网站上面的相识度,仿别人网站上面的模板来用,即使你使用不同的开源程序或者不用语言编写出来的程序都会产生页面的相识度过高。
网站上面的样板文字是大多数企业网站都会有的,这些样板文字的产生大多数都是站长在做网站的时候都喜欢在在网站的边栏上面放上一些全站使用的文章或者文字,比如说公司简介、联系我们…等一些无关紧要的,对于这些无关紧要的我们可以把它做成一张图片,添加上去就可以了。
采集的文章无论是从MD5算法,还是关键词匹配,都是在同一个网站上面,想要相识度不高,怎么会可能呢?
至于跟别人网站上面的相识度我们只要内容,跟他们不一样就可以了
有问题不可怕,知道了问题的产生我们改正就可以了,避免下次反同样的错误,建议大家尽量努力写原创的文章,原创的文章不仅仅搜索引擎喜欢,而且还能够降低网站页面与外部页面的相识度。