whyte-dwarf:自定义搜寻器和自动Solr索引更新器

时间:2024-06-12 08:18:43
【文件属性】:

文件名称:whyte-dwarf:自定义搜寻器和自动Solr索引更新器

文件大小:440KB

文件格式:ZIP

更新时间:2024-06-12 08:18:43

PHP

为何矮人 自定义搜寻器和自动Solr索引更新器 危险代码:目前未经过消毒的输入 要求: crawler_lists必须可写 crawler_json必须可写 编辑config / config.php以获取Solr设置和抓取延迟 使用表单来设置您的爬网参数。 在测试时,保存同一域的多个爬网/抓取,然后将所需的抓取数据推送到Solr,以准备进行索引和搜索。 我很快将添加简单的静态Solr适配器类,用于基于Silo的索引(基于域的键)的Example Schema.xml和用于示例使用的搜索表单。 设置Solr由您决定! 学分 PHP爬网 PHPCrawl由sminnee创建 Robots.class.php 机器人由安迪·彼得斯(Andy Pieters)创建 PHP简单HTML DOM解析器


网友评论