Sql server 的全文索引如何是否比 Lucene好

时间:2022-04-24 21:17:44
我们都知道 MS SQL SERVER 自自己有全文索引功能,为什么很多大网站做 全文索引都用Lucene 呢,难道数据库原生的支持还[ 不如第三方的 Lucene ,我也是全文索引初学者 ,可是我见报道 Lucene千万级数据就慢不无法忍受了,请问同级别数据环境下 是用SQL SERVER全文索引好,还是Lucene 好,我有一个项目可能要搜索近亿条文本

7 个解决方案

#1


帮顶....................没用过

#2


Sql server 的全文索引如何是否比 Lucene好
这个还真不清楚

#3


Lucene作为一个全文检索引擎,其具有如下突出的优点:
  (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。
  (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。
  (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。
  (4)设计了独立于语言和文件格式的文本分析接口,索引器通过接受Token流完成索引文件的创立,用户扩展新的语言和文件格式,只需要实现文本分析的接口。
  (5)已经默认实现了一套强大的查询引擎,用户无需自己编写代码即使系统可获得强大的查询能力,Lucene的查询实现中默认实现了布尔操作、模糊查询(Fuzzy Search[11])、分组查询等等。

#4


但是它的缺点是需要用JAVA去实现

#5


这个还真不知道,帮顶.

#6


没听过...........................

#7


引用 4 楼 fredrickhu 的回复:
但是它的缺点是需要用JAVA去实现


不是有Lucene.Net吗,我正在用.

#1


帮顶....................没用过

#2


Sql server 的全文索引如何是否比 Lucene好
这个还真不清楚

#3


Lucene作为一个全文检索引擎,其具有如下突出的优点:
  (1)索引文件格式独立于应用平台。Lucene定义了一套以8位字节为基础的索引文件格式,使得兼容系统或者不同平台的应用能够共享建立的索引文件。
  (2)在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件建立小文件索引,提升索引速度。然后通过与原有索引的合并,达到优化的目的。
  (3)优秀的面向对象的系统架构,使得对于Lucene扩展的学习难度降低,方便扩充新功能。
  (4)设计了独立于语言和文件格式的文本分析接口,索引器通过接受Token流完成索引文件的创立,用户扩展新的语言和文件格式,只需要实现文本分析的接口。
  (5)已经默认实现了一套强大的查询引擎,用户无需自己编写代码即使系统可获得强大的查询能力,Lucene的查询实现中默认实现了布尔操作、模糊查询(Fuzzy Search[11])、分组查询等等。

#4


但是它的缺点是需要用JAVA去实现

#5


这个还真不知道,帮顶.

#6


没听过...........................

#7


引用 4 楼 fredrickhu 的回复:
但是它的缺点是需要用JAVA去实现


不是有Lucene.Net吗,我正在用.