搜索引擎工作原理

李拴王
李拴王

发布于 2017-01-04 23:58

114 浏览
0 评论

做SEO两年有余,自身也积累了一些SEO的经验。我也和很多的同行交流了许多,从基本概念到优化策略,无所不包。我发现往往是交流到一些最基础的东西,我们很难准确的说出来。

现在凡事工作室给大家一一整理出来,今天主要是跟大家介绍一下,搜索引擎呈现网络的过程。

搜索引擎的整体架构示意图:

    图片1

 我们来看一下搜索引擎的架构(上图):

         1.网络爬虫爬行互联网连接;

  1.     2.网页计算去重;
  2.     3.添加索引;
  3.     4.内容,链接计算;
  4.     5.网页排序;
  5.     6.形成对应词典,存入cache系统;
  6.     7.用户检索;
  7.     8.分析内容,调出词典内容

  8. 这基本上是一个网页从产生到呈现的过程,当然这个过程很复杂,这里只是简单的比拟出来。不过我们可以看到,网络的爬虫对我们网站是何等的重要,这也是很多卖蜘蛛池的原因吧。

其次是网页的去重,因为现在百度自身服务器内部很多的网页缓存,蜘蛛爬去过得内容百度会经过一系列的计算后去除重复网页,这里面有一个比较复杂的算法,这个以后可以详细来讲。

我们看网页的排序有两个方面因素的影响:内容的相似性&链接分析,大概这就是我们常说的SEO“内容为王,外链为皇”理论依据吧。其实网页排序的影响因素有很多,但是内容和链接是基础的比较重要的影响因素。

网页排序之后就是生成关键词的词典存入搜索引擎的Cache系统,一方面可以快速的提供用户查询信息,另一方面就是减轻搜索引擎的计算压力。

这就是整个搜索引擎的基本工作原理。 

作者公告牌

精通SEO,熟练HTML+CSS,看懂PHP,玩转淘宝。QQ:545647425

举报 收藏
管理文章:
暂无回应