node-warc:使用 node.js 解析和创建 Web ARChive (WARC) 文件

时间:2024-08-24 03:46:46
【文件属性】:

文件名称:node-warc:使用 node.js 解析和创建 Web ARChive (WARC) 文件

文件大小:729KB

文件格式:ZIP

更新时间:2024-08-24 03:46:46

warc web-archiving webarchive web-archives webarchiving

节点warc 解析 Web 存档 (WARC) 文件或使用创建 WARC 文件 运行npm install node-warc或yarn add node-warc到 ge 开始 文档 完整文档可在 解析 使用异步迭代 需要节点 10 或更高 const fs = require ( 'fs' ) const zlib = require ( 'zlib' ) // recordIterator only exported if async iteration on readable streams is available const { recordIterator } = require ( 'node-warc' ) async function iterateRecords ( warcStream ) { for await ( const record of reco


【文件预览】:
node-warc-master
----.gitignore(2KB)
----package.json(2KB)
----.travis.yml(134B)
----LICENSE(1KB)
----index.js(2KB)
----CHANGELOG.md(4KB)
----README.md(6KB)
----.esdoc.json(971B)
----lib()
--------utils()
--------parsers()
--------writers()
--------warcRecord()
--------requestCapturers()
----misc()
--------externsPlugin.js(1019B)
--------externs.js(1KB)
----.npmignore(2KB)
----test()
--------helpers()
--------parsers.js(4KB)
--------capturedRequests.js(9KB)
--------utils.js(5KB)
--------testWARCWriterBase.js(34KB)
--------files()
--------testWarcFields.js(10KB)
--------puppeteer-capture-writer.js(2KB)
--------requestCapturers.js(17KB)
----yarn.lock(233KB)
----index.d.ts(12KB)

网友评论