网站优化技术配合一些搜索引擎高级指令将使得优化工作变得简单。
1、site
site:是SEO最熟悉的高级搜索指令,也是最常用的指令,用来搜索某个域名下收录的所有链接、文件!
2、domian:后跟完整域名,查询网站被百度收录的反向链接数目。
3、双引号(""):完全匹配搜索。
把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google 都支持这个指令。
4、减号(-):
减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和百度都支持这个指令。
例如:蜘蛛池 -搭建
返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果
5、星号
星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。
例如在Google中搜索:搜索*擎
其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。
6、inurl
inurl: 指令用于搜索查询词出现在url 中的页面。百度和Google 都支持inurl 指令。inurl 指令支持中文和英文。
例如:inurl:cjzzc
返回的结果都是网址url 中包含“搜索引擎优化”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。
7、inanchor
inanchor:指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持inanchor。
如在Google中搜索:inanchor:点击这里
返回的结果页面本身并不一定包含“点击这里”这四个字,而是指向这些页面的链接锚文字中出现了“点击这里”这四个字。
可以用来找到某个关键词的竞争对收,而且这些竞争对手往往是做过SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。
8、intitle
intitle: 指令返回的是页面title 中包含关键词的页面。Google 和百度都支持intitle 指令。
使用intitle 指令找到的文件是更准确的竞争页面。如果关键词只出现在页面可见文字中,
而没有出现在title 中,大部分情况是并没有针对关键词进行优化,所以也不是有力的竞争对手。
例如:返回的是页面title中包含关键词的页面。如“intitle:魅族”。
9、allintitle
allintitle:搜索返回的是页面标题中包含多组关键词的文件。
例如 :allintitle:SEO 搜索引擎优化
就相当于:intitle:SEO intitle:搜索引擎优化
返回的是标题中中既包含“SEO”,也包含“搜索引擎优化”的页面
10、allinurl
与allintitle: 类似。
allinurl:SEO 搜索引擎优化
就相当于 :inurl:SEO inurl:搜索引擎优化
11、filetype
用于搜索特定文件格式。Google 和百度都支持filetype 指令。
比如搜索filetype:pdf SEO
返回的就是包含SEO 这个关键词的所有pdf 文件。
12、linkdomain
linkdomain:指令只适用于雅虎,返回的是某个域名的反向链接。雅虎的反向链接数据还比较准
确,是SEO 人员研究竞争对手外部链接情况的重要工具之一。
例如:linkdomain:cjzzc.com -site:cjzzc.com
得到的就是点石网站的外部链接,因为-site:cjzzc.com 已经排除了点石本身的页面,也就是内部
链接,剩下的就都是外部链接了。
13、related
related:指令只适用于Google,返回的结果是与某个网站有关联的页面。比如搜索
搜索引擎的工作过程是引擎蜘蛛爬行和抓取、索引和排名。排名,即用户输入关键词后,
排名程序调用索引数据库,计算相关性,然后按一定格式生成搜索结果页面。
1、搜索词处理:中文分词处理,去除用户搜索中的停止词,指令处理,纠正拼写错误,整合索引出发。
2、文件匹配:找出含有所有关键词的文件。
3、初始子集的选择:文件匹配得出的子集还不能直接计算,因为匹配到的文件通常会几十几百上千万,
对这么多文件实时计算相关性需要很长时间,根据权重和相关性,百度提供76页大约760个搜索结果,
故会先选出权重较高的一个子集。
4、相关性计算:关键词常用程度、词频及密度,关键词位置及型式,关键词距离、链接分析及页面权重。
5、排名过滤及调整:主要过滤是施加惩罚,减少垃圾内容、作弊嫌疑页面,如百度11位,算法。
6、排名显示:经排名程序调用原始页面的标题、描述标签、快照日期等。
7、搜索缓存:用户搜索的关键词有很大一部分是重复的,将最常见的搜索词存入缓存,缩短搜索反应时间。
8、查询及点击日志:记录用户的IP地址、搜索的关联词、搜索时间及点击了哪些页面并存入搜索库。