Solr学习笔记之4、Solr配置文件简介

时间:2023-03-08 16:30:21

Solr学习笔记之4、Solr配置文件简介

摘自《Solr in Action》。

1、 solr.xml – Defines one or more cores per Solr server
2、 solrconfig.xml – Defines the main settings for a specific Solr core
3、 schema.xml – Defines the structure of your index including fields and field types

翻译如下:

1、solr.xml – 定义某个SolrServer的一个或者多个Core
2、solrconfig.xml – 特定Core的主要配置文件
3、schema.xml – 定义索引的域及域类型

他山之石:

1、schema.xml:该文件是索引的schema,包含了域类型的定义以及相关联的analyzer链。

2、solrconfig.xml:该文件是Solr的主配置文件。

3、data-config.xml:SQL逻辑与Filed映射关系配置。

schema.xml FieldType属性详解

fieldType 公共属性:

name:标识。

class:行为对应的类。

可选的属性:

sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上(包括:string,boolean,sint,slong,sfloat,sdouble,pdate)。

sortMissingLast=”true”:没有该field的数据排在有该field的数据之后,而不管请求时的排序规则。

sortMissingFirst=”true”:没有该field的数据排在有该field的数据之前,而不管请求时的排序规则。

indexed:是否被用来建立索引(关系到搜索和排序)。

stored:是否储存。

compressed:[false],是否使用gzip压缩(只有TextField和StrField可以压缩)。

mutiValued:是否包含多个值,即一个名字可以被多个document所用。

omitNorms:这是个高级选项。设置为true,省略与这一field相关的规范(这将禁用长度规范化和索引时间权重( index-time boosting for the field),并节省一些内存)。仅仅用在全文本field。

positionIncrementGap=N :可选属性,定义在同一个文档中此类型数据的空白间隔数,避免短语匹配错误。

schema.xml Field属性详解

常用的公共属性有:

name:标识。

type:fieldType定义的类型。

indexed=true|false:是否被用来建立索引(关系到搜索和排序)。

stored=true|false:是否储存。

compressed=true|false,是否使用gzip压缩(只有TextField和StrField可以压缩)。

compressThreshold=压缩阀值。

multiValued=true|false 是否包含多个值,即一个名字可以被多个document所用。

omitNorms=true|false这是个高级选项。设置为true,省略与这一field相关的规范(这将禁用长度规范化和索引时间权重( index-time boosting for the field),并节省一些内存)。仅仅用在全文本field。

termVectors=false|true 如果设置为true,则包含了所有的term vector 信息。通常用的属性有: termPositions=”true”:存储 term vector中的地址信息,会消耗存储开销。 termOffsets:存储 term vector 的偏移量,会消耗存储开销。 更多有关信息请参考:http://wiki.apache.org/solr/TermVectorComponent

omitTermFreqAndPositions=true|false 如果设置,省略掉freq和term vector中的地址信息。

omitPositions=true|false如果设置,省略掉term vector中的地址信息。

default:如果没有属性需要修改,就可以用这个标识下。