WebScraper - Web Data Extraction-开源

时间:2024-05-09 03:25:55
【文件属性】:

文件名称:WebScraper - Web Data Extraction-开源

文件大小:1.35MB

文件格式:ZIP

更新时间:2024-05-09 03:25:55

开源软件

设置简单的用Java编写的网络抓取工具。 它使用经过修改的regEx快速编写复杂的模式,以将数据解析出网站。 它包含一个用于测试配置脚本的GUI工具,并且可以通过命令行完全自动化


【文件预览】:
build
----scraper.jar(1.38MB)
----example()
--------wikipedia-config.txt(73B)
--------wikipedia-seeds.txt(122B)
--------crawl.sh(123B)
--------crawl.bat(123B)
----documentation()
--------gui.png(70KB)
--------scripts.js(68KB)
--------index.html(13KB)
--------style.css(3KB)
----start.sh(54B)
----start.bat(54B)

网友评论