EmpireWikiScraper:一个 nodejs 项目,它抓取了 Empire Larp Gazeteer 并将其转换为 json

时间:2024-07-08 04:00:30
【文件属性】:

文件名称:EmpireWikiScraper:一个 nodejs 项目,它抓取了 Empire Larp Gazeteer 并将其转换为 json

文件大小:13KB

文件格式:ZIP

更新时间:2024-07-08 04:00:30

JavaScript

帝国维基爬虫 一个 nodejs 项目,它抓取 Empire Larp Gazeteer 并将其转换为 json。 在运行之前,您需要安装 nodejs 并使用npm install下载依赖项。 您还需要 $PATH 目录中的 phantomjs 副本。 您可以通过标准包管理器或 npm 安装它。 要通过 npm 全局安装它,请使用命令npm install phantomjs -g 。 要运行使用node index.js --crawl抓取维基并将数据转换为本地 data.json 文件,使用node index.js --enrich使用补充数据丰富抓取的数据并提供完成的 Province.json 文件. 数据将输出到文件/output/provinces.json


网友评论