php使用solr全文搜索引擎

时间:2022-04-22 08:34:12

前言

  本来以为网上已经有了类似博文,不想重复,可是一圈搜下来,都是一些内容不甚明了的文章,或者solr版本太过老,参考价值不高,更有甚者,直接拷贝的别人的内容。一篇博客,各大平台都能看到,也不见转载链接。有人说百度搜索不到内容,用谷歌,把责任推到百度身上,但这是百度的原因吗?在国内网络的资源整体质量不高低,并且内容太多重复的情况下,百度能够提供什么高质量的内容给你。

也有我搜索资源的时候,会看到IBM开者中心的翻译文档,在文章的最后,都会附上参考文章,但是在国内,显有这种情况。那些拷贝别人博文的人,有没有想过,写一篇博文的不易?同样,博文作者是否也想过这个问题?话不多说,进入正题。

声明:因为本人不是从事java开发,而且技术不高,英语也很差,如果文章中存在错误的解说,望谅。

参考文章:

solr官方文档

solr扩展php官方手册

使用 PHP 和 Apache Solr 实现企业搜索

window环境

1,安装solr

下载solr,选择相应版本,注意:因为solr对是基于java的,所以必需安装jre。每个版本的 solr对jre版本要求不一样,下载时请注意solr的版本。

编写这篇博文时,solr的最新版本是6.6,文章也是基于6.6版本写的,其要求1.8版本或以上的jre。jre的安装,这些就不列出了,因为太过简单。

Window用户请下载zip包

php使用solr全文搜索引擎

将压缩包解压到相应目录

使用命令行工具,进入解压后的solr目录的bin目录

启动solr

运行命令: bin\solr.cmd start

php使用solr全文搜索引擎

 

 

注意:solr有两种模式:core,collection,如果要使用collection,请加-c或者-cloud,启用solrClund。两者之间的区别,我不敢妄下定论。从搜索的资料综合分析,一个是单机,一个是集群,此处仅供参考,可能存在错误。

solr默认监听的是8983端口

更多命令用法,请使用solr -help,如果solr已经启动,请使用solr start -help。

如果启动成功,可以在浏览器中打开:http://localhost:8983/solr/,使用其web管理客户端。

2,查看solr范例

先停止solr实例

bin\solr.cmd stop

再启用solr范例

bin\solr.cmd -e techproducts

打开web管理客户端:http://localhost:8983/solr/,查看结果

php使用solr全文搜索引擎

根据结果,可知道,techproducts范例*有32篇文章。

现在可以尝试他的查询功能。

我在q输入框中输入了Samsung,其得到的结果如下图php使用solr全文搜索引擎

3,添加文档

php使用solr全文搜索引擎php使用solr全文搜索引擎

添加好后,进入查询界面,看能否查到这篇文档

php使用solr全文搜索引擎

4,删除文档

php使用solr全文搜索引擎

返回查询界面,查询删除后的结果

php使用solr全文搜索引擎

solr是通过Request-Handler指令操作文档的,solr项目所有的Request-Handler指令都定义在项目目录的conf文件夹下的solrconfig.xml文件里requestHandler标签中。

关于添加文档更详细的说明清参考:Indexing and Basic Data Operations

5,创建solr项目

现在学会一些基本的操作,可以自己创建一个项目录了。

先把停止solr

solr.cmd stop -all

solr是一个实例可以有多个core或collection,如果不先停止,创建的core将会添加到启用的techproducts实例中

solr.cmd create -c test

 

php使用solr全文搜索引擎

重新刷新web客户端

php使用solr全文搜索引擎

6,下载php的solr扩展

现在开始使用php和solr交互了,所以必需安装solr扩展,下载地址

下载解压之后,将其中的dll文件放到php的扩展目录,对于php扩展所在目录,然后在php.ini开启solr扩展,再通phpinfo查看是否正常安装。

我默认所有读者都知道php扩展配置方式,所有这里不详细描述。

注意:php有Thread Safe和NoneThread Safe之分,下载之前,请先确定你安装的php是哪种类型。

7,使用php脚本添加文档

$options = array
(
'hostname' => "localhost",
'path' => 'solr/test',
'port' => '8983',
);

$client = new SolrClient($options);
$data = array(
array(
'id' => 'EN80922032',
'name' => '男士打磨直筒休闲牛仔裤',
'brand' => 'ENERGIE',
'cat' => '牛仔裤',
'price' => '1870.00'
)
,
array(
'id' => 'EN70906025',
'name' => '品牌LOGO翻领拉链外套',
'brand' => 'ENERGIE',
'cat' => '外套',
'price' => '1680.00'
)
,
);


foreach($data as $key => $value) {
$doc = new SolrInputDocument();
foreach($value as $key2 =>$value2) {
$doc->addField($key2,$value2);
}
$client->addDocument($doc);

}
$client->commit();

在solr的web客户端查询的结果

php使用solr全文搜索引擎

更多实例请见:php的solr扩展官方文档

注意:参考官方文档时,注意其连接参数,依其博文必需有path参数,path参数是"solr/",加上你用solr创建的core名称。

9,使用php脚本查询文档

$options = array
(
'hostname' => "localhost",
'path' => 'solr/test',
'port' => '8983',
);

$client = new SolrClient($options);
$query = new SolrQuery();

$query->setQuery('打磨');

$query->setStart(0);

$query->setRows(50);

$query->addField('name');

$query_response = $client->query($query);

$response = $query_response->getResponse();

print_r($response);

输入的结果

SolrObject Object
(
[responseHeader]
=> SolrObject Object
(
[status]
=> 0
[QTime]
=> 3
[params]
=> SolrObject Object
(
[q]
=> 打磨
[indent]
=> on
[fl]
=> name
[start]
=> 0
[rows]
=> 50
[version]
=> 2.2
[wt]
=> xml
)

)

[response]
=> SolrObject Object
(
[numFound]
=> 1
[start]
=> 0
[docs]
=> Array
(
[
0] => SolrObject Object
(
[name]
=> Array
(
[
0] => 男士打磨直筒休闲牛仔裤
)

)

)

)

)

10,使用php脚本删除文档

$client->deleteByQuery('id:EN80922032'); 
$result = $client->commit();
print_r($result);

输出的结果不易看懂

可以使用第九条“使用php脚本查询文档”,查看删除后的结果,也可以用web客户端查看结果。

11,更新文档

更新文档和添加文档一样,只要在数据中指定要更新的id即可。

结语:水平有限,只能写这么多。如果有时间,我将持续更新此博文。