RegexQuery正则表达式源代码
来源:互联网 发布:ssr软件 编辑:程序博客网 时间:2024/06/09 16:50
package query;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
public class RegexQuery {
public static void main(String[] args) {
// TODO 自动生成的方法存根
IndexWriter writer = new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);
//创建8个文档
Document doc1 = new Document();
Document doc2 = new Document();
Document doc3 = new Document();
Field f1 = new Field("content", "word",Field.Store.YES, Field.Index.TOKENIZED);
Field f2 = new Field("content", "work",Field.Store.YES, Field.Index.TOKENIZED);
Field f3 = new Field("content", "world",Field.Store.YES, Field.Index.TOKENIZED);
doc1.add(f1);
doc2.add(f2);
doc3.add(f3);
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();
IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH);
//构建1个个正则表达式,用于匹配所有域名abc.com的地址
String regex = "http://[a-z]{1,3}\\.abc\\.com/.*";
//构成term
Term t = new Term("url", regex);
//创建正则查询
RegexQuery query = new RegexQuery(t);
//打印查询结果
Hits hits = searcher.search(query);
for(int i = 0; i < hits.length(); i++){
System.out.println(hits.doc(i));
}
}
}
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
public class RegexQuery {
public static void main(String[] args) {
// TODO 自动生成的方法存根
IndexWriter writer = new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);
//创建8个文档
Document doc1 = new Document();
Document doc2 = new Document();
Document doc3 = new Document();
Field f1 = new Field("content", "word",Field.Store.YES, Field.Index.TOKENIZED);
Field f2 = new Field("content", "work",Field.Store.YES, Field.Index.TOKENIZED);
Field f3 = new Field("content", "world",Field.Store.YES, Field.Index.TOKENIZED);
doc1.add(f1);
doc2.add(f2);
doc3.add(f3);
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();
IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH);
//构建1个个正则表达式,用于匹配所有域名abc.com的地址
String regex = "http://[a-z]{1,3}\\.abc\\.com/.*";
//构成term
Term t = new Term("url", regex);
//创建正则查询
RegexQuery query = new RegexQuery(t);
//打印查询结果
Hits hits = searcher.search(query);
for(int i = 0; i < hits.length(); i++){
System.out.println(hits.doc(i));
}
}
}
0 0
- RegexQuery正则表达式源代码
- RegexQuery正则搜索
- 一步一步跟我学习lucene(15)---java读取word excel pdf及lucene搜索之正则表达式查询RegExQuery和手机邮箱查询示例
- lucene-SpanQuery精解和与正则RegexQuery精解
- 正则表达式 测试工具 源代码
- 正则表达式,轻松查看项目源代码行数
- 用正则表达式去掉源代码行号
- java采集网址正则表达式(源代码)
- 源代码---java正则表达式匹配字符串
- 正则表达式应用之过滤空格(JavaScript,源代码)
- 正则表达式应用之过滤空格(JavaScript,源代码)
- 利用notepad++和正则表达式快速清除源代码行号
- python 正则表达式过滤文本中的html标签 源代码解析
- javascript正则表达式,源代码为dorado框架的
- 【正则表达式】正则表达式
- 正则表达式
- 正则表达式
- 正则表达式
- Linux 下串口USB等设备通信编程入门2
- 新人报道下
- Android 零碎知识点汇总
- centos6.4 python beautifulsoup安装
- CocosEditor-java onContactBegin无反应
- RegexQuery正则表达式源代码
- ‘close’ was not declared in this scope
- 委托和事件的区别
- 问,LINUX AS 6能对一个LV进行动态的增加空间吗?
- GCC源码分析(3):Tree-SSA优化框架
- 虚拟现实技术实现理论之梦境论述
- 软件质量之道:PCLint之一
- 尴尬者的求职指南
- 输入流、输出流的特性和读写方法