搜索引擎发展史汇总

2014-10-31
  • 810
  • 0
        今天就把搜索引擎的“先祖”们一个个刨出来看看,或许对我们认识搜索引擎有所帮助。
        每种技术的发展史都在当时的阶段有不同的技术侧重点,搜索引擎也不例外,其发展速度更是级数倍的增长。
        最初的网民对网页的要求很低,只要求相关性就可以了,甚至根本就谈不上要求,主要是意识处于初级阶段,这主要是因为当时的互联网还处于种子时期,互联网发展了这么多年,可以说是历尽坎坷,虽然也取得了成绩,获得了社会认可;目前的互联网充其量也就是刚刚发芽而已,机会还是很多的。
        我们还是直入正题吧。
        听说第一代说得过去的搜索引擎叫做“文本检索式搜索引擎”,用户输入需要查询的关键词,搜索引擎通过关键词匹配网页的相关性,当时只有这一个维度的模糊判断,相当的简陋。这是一种假设性的查询关键词,根本无法满足用户的真实需求,很明显这种假设很难成立。同时,这种搜索方式展现给用户的信息可信度并未做任何的处理。
        我们来说说第二代搜索引擎的发展吧!这一代的搜索引擎很有意思,至少在思维上稍微的符合了自然规律,这一代的搜索技术引入了链接分析,独立的链接就像是一个独立自然人一样,链接的关系就像是一个人的朋友,它隐含的代表了一种推荐和认可的含义,获得更多的其他链接的推荐网页,就会被判断为高质量网页,其实这种判断方法还是可行的。文本检索的方式在这个时候进行了改进和加强,查询到的网页更加精准了,而且内容也越来越可信了。第二代搜索引擎是考虑解决了信息的相关度和信任度的问题,虽然不尽如人意,但是已经是很大的进步了,它同样没有对搜索者的真实需求进行深刻的关注。
        我们目前接触到的主流搜索引擎都可以划归到第三代搜索引擎上,这就是以主动的理解用户需求为核心。这一代的搜索引擎从架构层面进行了改良,对百亿级别的网页进行抓取、分析、存储、处理的能力有了质的提高。更多维度的搜索匹配让搜索引擎成为用户的先知,大数据的积累更是让搜索引擎如虎添翼。
        插播一下广告:搜索引擎有一位干爹,那就是传说中的分类目录,用户可以使用分级别的目录来查找相关且高质量的网站,这是最原始的方式,并不存在任何高深的技术手段,被收录的网站的确是高质量的,但是由于范围的局限性,绝大多数的网站是根本没有机会被收录的,所以就“断后”了。
        说搜索引擎能够领导互联网的发展,这一点也不夸张,尽管他的使用方式非常的简单:用户输入搜索词汇,搜索引擎给出用户想要的结果。这看似简单的输入和输出,里面包含了世界一流的软硬件和技术手段。总结一下:搜索引擎技术所希望达到的终极目标可以简化为:更全、更快、更准。