超级蜘蛛池

超级蜘蛛池之SEO指令和搜索引擎的排名过程

时间:2017-08-28 22:04 |  作者:www.cjzzc.com |  阅读:(373)


网站优化技术配合一些搜索引擎高级指令将使得优化工作变得简单。

SEO常用搜索引擎高级命令

1、site 

site:是SEO最熟悉的高级搜索指令,也是最常用的指令,用来搜索某个域名下收录的所有链接、文件!

例如:site:www.cjzzc.com

2、domian:后跟完整域名,查询网站被百度收录的反向链接数目。

例如:domain:www.cjzzc.com

3、双引号(""):完全匹配搜索。

把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google 都支持这个指令。

例如: "超级蜘蛛池:教你查看日志中蜘蛛的访问行为"

4、减号(-):

  减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和百度都支持这个指令。 

例如:蜘蛛池 -搭建

返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果

5、星号 

星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。 

例如在Google中搜索:搜索*擎 

其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。

6、inurl 

inurl: 指令用于搜索查询词出现在url 中的页面。百度和Google 都支持inurl 指令。inurl 指令支持中文和英文。 

例如:inurl:cjzzc

返回的结果都是网址url 中包含“搜索引擎优化”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。

7、inanchor 

inanchor:指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持inanchor。 

在Google中搜索:inanchor:点击这里 

返回的结果页面本身并不一定包含“点击这里”这四个字,而是指向这些页面的链接锚文字中出现了“点击这里”这四个字。 

可以用来找到某个关键词的竞争对收,而且这些竞争对手往往是做过SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。

8、intitle 

intitle: 指令返回的是页面title 中包含关键词的页面。Google 和百度都支持intitle 指令。 

使用intitle 指令找到的文件是更准确的竞争页面。如果关键词只出现在页面可见文字中,

而没有出现在title 中,大部分情况是并没有针对关键词进行优化,所以也不是有力的竞争对手。

例如:返回的是页面title中包含关键词的页面。如“intitle:魅族”。

9、allintitle 

allintitle:搜索返回的是页面标题中包含多组关键词的文件。 

例如 :allintitle:SEO 搜索引擎优化 

就相当于:intitle:SEO intitle:搜索引擎优化 

返回的是标题中中既包含“SEO”,也包含“搜索引擎优化”的页面

10、allinurl 

与allintitle: 类似。 

allinurl:SEO 搜索引擎优化 

就相当于 :inurl:SEO inurl:搜索引擎优化

11、filetype 

用于搜索特定文件格式。Google 和百度都支持filetype 指令。 

比如搜索filetype:pdf SEO 

返回的就是包含SEO 这个关键词的所有pdf 文件。

12、linkdomain 

linkdomain:指令只适用于雅虎,返回的是某个域名的反向链接。雅虎的反向链接数据还比较准 

确,是SEO 人员研究竞争对手外部链接情况的重要工具之一。 

例如:linkdomain:cjzzc.com -site:cjzzc.com

得到的就是点石网站的外部链接,因为-site:cjzzc.com 已经排除了点石本身的页面,也就是内部 

链接,剩下的就都是外部链接了。

13、related 

related:指令只适用于Google,返回的结果是与某个网站有关联的页面。比如搜索 

related:cjzzc.com


搜索引擎的工作过程是引擎蜘蛛爬行和抓取、索引和排名。排名,即用户输入关键词后,

排名程序调用索引数据库,计算相关性,然后按一定格式生成搜索结果页面。

搜索引擎排名过程是与用户直接互动的

1、搜索词处理:中文分词处理,去除用户搜索中的停止词,指令处理,纠正拼写错误,整合索引出发。

2、文件匹配:找出含有所有关键词的文件。

3、初始子集的选择:文件匹配得出的子集还不能直接计算,因为匹配到的文件通常会几十几百上千万,

对这么多文件实时计算相关性需要很长时间,根据权重和相关性,百度提供76页大约760个搜索结果,

故会先选出权重较高的一个子集。

4、相关性计算:关键词常用程度、词频及密度,关键词位置及型式,关键词距离、链接分析及页面权重。

5、排名过滤及调整:主要过滤是施加惩罚,减少垃圾内容、作弊嫌疑页面,如百度11位,算法。

6、排名显示:经排名程序调用原始页面的标题、描述标签、快照日期等。

7、搜索缓存:用户搜索的关键词有很大一部分是重复的,将最常见的搜索词存入缓存,缩短搜索反应时间。

8、查询及点击日志:记录用户的IP地址、搜索的关联词、搜索时间及点击了哪些页面并存入搜索库。