SEO权威指南第二章:搜索引擎是如何工作的?

SEO权威指南第二章:搜索引擎是如何工作的?

欢迎来到SEO权威指南第二章:

在这一章中我们将讨论像谷歌这样的行业领导者它们拥有的搜索引擎是如何工作的,相信电脑前你和许多人都想过同样的问题,搜索引擎是如何根据客户输入的问题来分析整理网络世界中海量的数据的呢?

今天我们就来看看搜索引擎寻找答案的方法首先搜索引擎必须要先能找到一个网站,然后才能够将网站的内容纳入它的搜索结果里进行排序。

如果一个网站本身的优化做得不够好,那么就意味着当用户在搜索的时候,你的网站根本无缘于进入搜索结果的第四或者第五页之前的网页,而现实生活中上只有百分之一的用户会在浏览完了第一页的搜索结果之后再去浏览第二页,那么你的网站根本没有可能被用户搜索到。今天,SEO指南将向你介绍怎么才能让自己的主页拥有更多访问量。

搜索引擎的种类

搜索引擎分为两种:

独立/开源式搜索引擎:由工程师们自发搭建的搜索引擎,例如谷歌,雅虎。

预处理式搜索引擎:为专业工作者设计的付费式搜索引擎,例如Microsoft Bing,AOL49。

搜索引擎的信息爬取

搜索器在对搜索结果进行索引和排序时的第一步便是爬取链接信息,它们通过不停地访问一个又一个网站来寻找新的内容。这些搜索引擎向这些网站里的每个页面发送“爬取”指令,这些命令在获取了页面的链接之后返回至数据库并将链接添加其中,比如谷歌使用的Caffeine数据库。这些链接将在这里被编译在一起,形成一个能通向所有网页的索引。

每当搜索引擎从你的网页上采集到了一个链接之后,它便会重新将这个链接后面可能引导出的每一个页面的链接重新爬取一遍。就像一个蜘蛛网那样,通过无数上千次的延申最终覆盖整个互联网,实际上这样繁杂庞大的工作在我们的生活中无时无刻不在进行!

pagerank

搜索引擎建立索引的过程

在拥有了一个网站所有页面的链接之后,搜索引擎便会建立一个对应的索引。在索引中搜索引擎会根据爬取的链接,网页中的内容和内容中特定的关键词来建立起一个排序列表。

对搜索结果排序

在索引完成之后,搜索引擎会根据排序表上的内容对每个网页进行相应的权重排序,这样做的目的是确保使用者们的每一次搜索都能获得关联性依次递减的若干个搜索结果。这就是我们所说的Page Rank。尽管包括谷歌搜索器在内的大部分搜索引擎都会根据若干种不同的权重因子来进行排序,但这些权重因子实际上都是建立在网页排名Page Rank和页面权重Page Authority的理论之上。

什么是PageRank和Page Authority?

Page Rank即负责给每个页面进行价值评分的系统。网站在Page Rank中的得分越高,就意味着互联网用户每一次搜索时,这个网站出现在更靠前的地方就更高,那么对应的访问你网站的流量也就越多。

Page Authority的主要任务是检测有多少个网页上有能够进入到某一个特定网页的链接,指向这一特定网页的网页越多,就意味着其他人对你的网页的评价越高,那么你的网站在参与排序时获得的权重也就越高。

虽然每个搜索引擎对于不同种类网站的页面所使用的排序方法不尽相同,但是它们主要是基于以下几点:

  1. 指向该页面的链接数量。(即Page Rank测试法)
  2. 页面重要性。(page authority 或者trust flow)
  3. 内容相关性。(如网页内容中的关键字)

backlinks

提示:

不要试图在搜索引擎对网站的评估中作弊,一旦你的网站被发现为对一个搜索结果并没有太大关联,但之前你通过篡改链接数量或者其他方法间接影响了你与其他网站的关联程度,那么你的网站在被ranking时将收到严重的降权惩罚。

不要让自己的页面出现data error现象,如果搜索引擎在一个网站中发现了404 not found页面,它判定这是一个已经崩溃的链接并且给予整个同一域名网站下的所有链接降权惩罚。

在下一节的chapter 3中,我们将讨论对关键字的分析和研究。点击如下链接,阅读所有关于搜索引擎(Search Engine Optimization)和网站优化的文章。