webcrawler:带有 apache nutch 和 solr 的网络爬虫

时间:2024-06-19 11:26:35
【文件属性】:

文件名称:webcrawler:带有 apache nutch 和 solr 的网络爬虫

文件大小:58KB

文件格式:ZIP

更新时间:2024-06-19 11:26:35

JavaScript

Nutch 和 Solr (参见 ) 版本 1. 索尔 Solr 用于 8.5.1(或 7.3.1)版本wget http://archive.apache.org/dist/lucene/solr/8.5.1/solr-8.5.1.tgz 2. 阿帕奇纳奇 使用 Apache Nutch 版本 1.17(或 1.16)。 wget http://archive.apache.org/dist/nutch/1.17/apache-nutch-1.17-bin.tar.gz 3.搜索栏 一个小节点应用程序(搜索栏)用于搜索 Solr。 这绑定到端口 3000 并在内部调用本地 Solr 服务器, 安装 wget http://archive.apache.org/dist/lucene/solr/8.5.1/solr-8.5.1.tgz wget http://archive.apach


【文件预览】:
webcrawler-master
----package-lock.json(27B)
----searchbar()
--------JS()
--------package.json(177B)
--------server.js(2KB)
--------package-lock.json(31KB)
--------views()
--------response.json(13KB)
--------README.md(328B)
----run-crawler.sh(3KB)
----.gitignore(186B)
----README.md(6KB)

网友评论