全文检索Lucene和Solr简介

来源:互联网 发布:数据信息化管理 编辑:程序博客网 时间:2024/06/02 21:43

       在电商项目中,经常会遇到的是海量数据的查询。如果在海量数据中进行查询的话,使用sql语句进行查询的话,效率非常的低。
       使用Lucene和Solr就是为了解决这种问题的。

首先,Lucene是干什么用的?Solr又是干什么用的?
       lucene是apache出品的一个开源的全文检索框架。提供了完整的查询引擎和索引引擎。他可以做全文索引和搜索。经常用于海量数据的查询中。

Lucene是如何使用的?
       Lucene中有一个工具,会专门的对数据建立索引信息。然后把索引信息存放到索引库中。

Lucene的结构:
lucene结构

什么是Solr?
       solr是一个应用服务器。他向外部提供了类似WebService的API接口,用户可以过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。

       Solr是基于Lucene进行开发的。可以说是对Lucene的再次封装。这样做的好处,就是我们不需要封装操作索引的相关方法了。可以直接使用solr的api操作索引。

lucene和solr的差别:
lucene和solr的差别

       如果我们在项目中需要对海量数据进行查询,首先要做的是对那些数据建立索引。之后,我们的查询就针对的是solr库里面的索引目录了。随后又指向性的在海量数据中查找,所以这种检索方式比传统的sql直接查询数据源的效率要高很多。

0 0
原创粉丝点击