Sphinx是一个在GPLv2下分发的全文检索引擎;Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行,商业使用(例如, 嵌入到其他程序中)需要联系我们以获得商业授权。
一般而言,Sphinx是一个独立的全文搜索引擎;而Coreseek是一个支持中文的全文搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的中文全文搜索能力。Sphinx/Coreseek可以非常容易的与SQL数据库和脚本语言集成。
Coreseek是也就是LibMMSeg和sphinx的结合,在sphinx0.99之前,要安装LibMMSeg的中文分词都要给sphinx打上中文补丁然后再安装,到这0.99,他们就把sphinx和LibMMSeg结合在一起提供中文搜索服务,不在以补丁的形式提供。
进入上一节下载的coreseek的目录下进行安装:
. / configure -- prefix =/ usr / local / coreseek -- with - mysql =/ usr / local / mysql -- with - mmseg =/ usr / local / mmseg -- with - mmseg - includes =/ usr / local / mmseg / include / mmseg / -- with - mmseg - libs =/ usr / local / mmseg / lib /
make && make install
这里的安装跟上一篇安装的sphinx一样的,就是加入了LibMMseg分词,安装完创建测试数据,创建搜索配置文件csft.conf,过程跟上一篇一样,但是创建索引时报了一个这样的错误:FATAL: index 'test1': 'synonyms': failed to open '/data/exceptions.txt',进入配置文件csft.conf,把/data/exceptions.txt注释掉即可,创建完索引,远行测试OK。
安装和配置都讲完了,下篇讲sphinx的使用。