solr 4.2近义词配置，使用的是IKAnalyzer2012FF_u1版本时无法实现近义词处理

来源：互联网发布：淘宝网儿童玩具迫击炮编辑：程序博客网时间：2024/06/02 13:05

最近要弄商品搜索近义词功能，比如输入商汞要搜到混泥土，我用的是solr4.2版本，网上转了一圈都没有我要的方案，也没有现成的类，

于是找到 lucene TokenFilterFactory类

但我用的是IKAnalyzer2012FF_u1版本其中分词只有

IKAnalyzer.class这个类，而近义词已工厂方式去处理，故在org.wltea.analyzer.lucene 包下加了个 IKTokenizerFactory主要是已工厂方式去处理

代码如下

package org.wltea.analyzer.lucene;

import java.io.Reader;
import java.util.Map;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.util.TokenizerFactory;

public class IKTokenizerFactory extends TokenizerFactory {

private boolean isMaxWordLength = false;

public void init(Map<String, String> args) {
String _arg = (String) args.get("isMaxWordLength");
this.isMaxWordLength = Boolean.parseBoolean(_arg);
}

public Tokenizer create(Reader reader) {
return new IKTokenizer(reader, isMaxWordLength());
}

public void setMaxWordLength(boolean isMaxWordLength) {
this.isMaxWordLength = isMaxWordLength;
}

public boolean isMaxWordLength() {
return this.isMaxWordLength;
}
}

编译后放到org.wltea.analyzer.lucene 包下

以前我只能这样定义ik分词但是不能实现近义词功能

加入IKTokenizerFactory类后改造成（可以在solr 核下的conf 下 synonyms.txt 文件配置自己的近义词库）

0 0