solr 配置中文分析器/定义业务域/配置DataImport功能方法(测试用)

时间:2022-10-15 22:23:58

一、配置中文分析器

使用IKAnalyzer

配置方法:

1)把IK的jar包添加到solr工程中/WEB-INF/lib目录下

2)把IK的配置文件扩展词典,放到classpath下。/WEB-INF/classes目录下

3)在schema.xml中定义FieldType,指定使用IK作为分析器

?
1
2
3
4
<!-- IKAnalyzer-->
  <fieldType name="text_ik" class="solr.TextField">
   <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  </fieldType>

4)重启tomcat

二、业务域的定义

1)创建数据库

需要导入的字段:pid,name,catelog_name,price,description,picture

2)每个字段需要对应索引库中的一个field

一条记录对应一个Document,一个字段对应一个域

schema.xml中:

?
1
2
3
4
5
6
7
8
9
<!--product-->
  <field name="product_name" type="text_ik" indexed="true" stored="true"/>
  <field name="product_price" type="float" indexed="true" stored="true"/>
  <field name="product_description" type="text_ik" indexed="true" stored="false" />
  <field name="product_picture" type="string" indexed="false" stored="true" />
  <field name="product_catalog_name" type="string" indexed="true" stored="true" />
  <field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>
  <copyField source="product_name" dest="product_keywords"/>
  <copyField source="product_description" dest="product_keywords"/>

三、配置DataImport功能(测试用)

步骤:

1、把DataImport插件需要的jar包添加到solr中

solr-dataimporthandler-4.10.3.jar
solr-dataimporthandler-extras-4.10.3.jar

可以放到solrhome/Collection1/lib目录下

2、需要mysql的数据库驱动的jar包

可以放到Collection1/lib目录下

3、需要在solrconfig.xml添加一个RequestHandler处理器

?
1
2
3
4
5
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
  <lst name="defaults">
  <str name="config">data-config.xml</str>
  </lst>
  </requestHandler>

4、在solrconfig.xml配置文件所在的目录添加一个data-config.xml文件

配置连接数据库的连接串

查询数据库的sql语句

结果集和索引库的映射关系

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig
<dataSource type="JdbcDataSource"
     driver="com.mysql.jdbc.Driver"
     url="jdbc:mysql://localhost:3306/solr"
     user="root"
     password="root"/> 
<document
  <entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products ">
     <field column="pid" name="id"/>
     <field column="name" name="product_name"/>
     <field column="catalog_name" name="product_catalog_name"/>
     <field column="price" name="product_price"/>
     <field column="description" name="product_description"/>
     <field column="picture" name="product_picture"/>
  </entity
</document
 
</dataConfig>

5、重启tomcat

以上这篇solr 配置中文分析器/定义业务域/配置DataImport功能方法(测试用)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。

原文链接:http://www.cnblogs.com/javaxiaoxin/archive/2017/09/11/7507155.html