文件名称:scraperboard:Golang 库可根据简单的 XML 声明轻松抓取网站
文件大小:15KB
文件格式:ZIP
更新时间:2024-07-02 05:48:19
Go
这是收集反馈的早期版本。 API 和 XML 格式可能会发生变化。 我很想知道你的想法,所以或 Scraperboard 允许您以声明方式定义刮板。 主要特征包括: 从 HTML 网站轻松提取结构化数据 根据定义的刮板从 HTML 生成 JSON 创建 REST API 以提供抓取的 JSON 如何申报刮刀 从 Google 搜索中提取结果 < Scraper> < Each xss=removed xss=removed> li " > < Property xss=removed xss=removed> < Property xss=removed xss=removed> < Filter xss=removed> < Fi
【文件预览】:
scraperboard-master
----testdata()
--------schema-org-events.json(175B)
--------markdown.md(221B)
--------title_and_list_links.json(88B)
--------list_link_names.xml(145B)
--------markdown.html(444B)
--------title_and_list_links.html(164B)
--------title_and_list_links.xml(186B)
--------title.xml(96B)
--------markdown_reader.md(247B)
--------schema-org-events.html(2KB)
--------schema-org-events.xml(324B)
----scraper.go(7KB)
----extract.go(953B)
----examples()
--------google-cli()
--------google-api()
----markdownify_test.go(1KB)
----README.md(4KB)
----http.go(785B)
----.gitignore(50B)
----scraper_test.go(3KB)
----markdownify.go(3KB)