理解搜索引擎

搜索引擎的分类

1. 全文搜索引擎(Google、百度)

基于对原数据的捕捉、分析、储存、索引等技术

2. 目录索引(LookSmart、About)例如:搜索某某某

人类->男人or女人->中国->某某某

3. 元搜索引擎(同时在其多个引擎上进行搜索)

基于全文搜索引擎技术,将用户提交的检索请求发送到多个独立搜索引擎上去搜索。

 抓取网页的策略

关注网站与蜘蛛的交流

 

建立索引(倒排序法)

Bruce-1

分词的改进

忽略没用的词

建立相应语言的词库

关注语义

耐特康赛网络技术(北京)有限公司.版权所有 京ICP备13018368号-2       

我们的服务

品牌活动

营销分享

联系我们

扫一扫关注我们

耐特康赛网络技术(北京)有限公司.版权所有京ICP备 13018368号-2

分享