kensaku_crawler

时间:2024-06-02 15:06:26
【文件属性】:

文件名称:kensaku_crawler

文件大小:565KB

文件格式:ZIP

更新时间:2024-06-02 15:06:26

JavaScript

概述 该项目使用Pupperter抓取数据,使用cheerio解析HTML。 如何开始 yarn install 第1步:将所有数据抓取为html。 yarn start 这将输出存储所有html文件的文件夹results 。 步骤2:解析HTML数据 yarn parse ---->输出: outputs/data.json 选项:将json转换为html 将json2csv安装为全局 npm install global json2csv yarn csv ---->输出: outputs/data.cvs


【文件预览】:
kensaku_crawler-main
----README.MD(465B)
----package.json(380B)
----outputs()
--------data.csv(758KB)
--------data.json(2.21MB)
----screenshot.png(139KB)
----src()
--------index.js(4KB)
--------screenshot.js(413B)
--------parser.js(4KB)
----.gitignore(25B)
----yarn.lock(20KB)

网友评论