IKAnalyzer 扩展分词库

时间:2022-08-31 19:48:33

在solr中加入自己的扩展分词库方法:

参考文章:

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 

 

1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes

 

2、新增一个文件:IKAnalyzer.cfg.xml

IKAnalyzer 扩展分词库
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典-->
<entry key="ext_dict">my.dic;</entry>

<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry>

</properties>
IKAnalyzer 扩展分词库

说明:

my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。

 

3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:

西丽

 

4、保存,重启solr。

使用了新的分词,需要重新建索引数据。

 

5、测试:

IKAnalyzer 扩展分词库

分类: [solr]