文件名称:WebScraper - Web Data Extraction-开源
文件大小:1.35MB
文件格式:ZIP
更新时间:2024-05-09 03:25:55
开源软件
设置简单的用Java编写的网络抓取工具。 它使用经过修改的regEx快速编写复杂的模式,以将数据解析出网站。 它包含一个用于测试配置脚本的GUI工具,并且可以通过命令行完全自动化
【文件预览】:
build
----scraper.jar(1.38MB)
----example()
--------wikipedia-config.txt(73B)
--------wikipedia-seeds.txt(122B)
--------crawl.sh(123B)
--------crawl.bat(123B)
----documentation()
--------gui.png(70KB)
--------scripts.js(68KB)
--------index.html(13KB)
--------style.css(3KB)
----start.sh(54B)
----start.bat(54B)