Solr学习笔记之4、Solr配置文件简介
摘自《Solr in Action》。
1、 solr.xml – Defines one or more cores per Solr server
2、 solrconfig.xml – Defines the main settings for a specific Solr core
3、 schema.xml – Defines the structure of your index including fields and field types
翻译如下:
1、solr.xml – 定义某个SolrServer的一个或者多个Core
2、solrconfig.xml – 特定Core的主要配置文件
3、schema.xml – 定义索引的域及域类型
他山之石:
1、schema.xml:该文件是索引的schema,包含了域类型的定义以及相关联的analyzer链。
2、solrconfig.xml:该文件是Solr的主配置文件。
3、data-config.xml:SQL逻辑与Filed映射关系配置。
schema.xml FieldType属性详解
fieldType 公共属性:
name:标识。
class:行为对应的类。
可选的属性:
sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上(包括:string,boolean,sint,slong,sfloat,sdouble,pdate)。
sortMissingLast=”true”:没有该field的数据排在有该field的数据之后,而不管请求时的排序规则。
sortMissingFirst=”true”:没有该field的数据排在有该field的数据之前,而不管请求时的排序规则。
indexed:是否被用来建立索引(关系到搜索和排序)。
stored:是否储存。
compressed:[false],是否使用gzip压缩(只有TextField和StrField可以压缩)。
mutiValued:是否包含多个值,即一个名字可以被多个document所用。
omitNorms:这是个高级选项。设置为true,省略与这一field相关的规范(这将禁用长度规范化和索引时间权重( index-time boosting for the field),并节省一些内存)。仅仅用在全文本field。
positionIncrementGap=N :可选属性,定义在同一个文档中此类型数据的空白间隔数,避免短语匹配错误。
schema.xml Field属性详解
常用的公共属性有:
name:标识。
type:fieldType定义的类型。
indexed=true|false:是否被用来建立索引(关系到搜索和排序)。
stored=true|false:是否储存。
compressed=true|false,是否使用gzip压缩(只有TextField和StrField可以压缩)。
compressThreshold=压缩阀值。
multiValued=true|false 是否包含多个值,即一个名字可以被多个document所用。
omitNorms=true|false这是个高级选项。设置为true,省略与这一field相关的规范(这将禁用长度规范化和索引时间权重( index-time boosting for the field),并节省一些内存)。仅仅用在全文本field。
termVectors=false|true 如果设置为true,则包含了所有的term vector 信息。通常用的属性有: termPositions=”true”:存储 term vector中的地址信息,会消耗存储开销。 termOffsets:存储 term vector 的偏移量,会消耗存储开销。 更多有关信息请参考:http://wiki.apache.org/solr/TermVectorComponent
omitTermFreqAndPositions=true|false 如果设置,省略掉freq和term vector中的地址信息。
omitPositions=true|false如果设置,省略掉term vector中的地址信息。
default:如果没有属性需要修改,就可以用这个标识下。