文件名称:CrawlScript-bin-beta0.3 JAVA的爬虫脚本语言
文件大小:7MB
文件格式:ZIP
更新时间:2017-02-09 17:17:57
爬虫 JAVA 脚本 网络 crawl
CrawlScript-bin-beta0.3 ,CrawlScript语言0.3beta版,无需配置。 JAVA的爬虫脚本语言,用几行代码即可实现对整个网站的爬取,直接执行demo中的代码,可以获取整个新华网的所有的新闻(从网页中提取出的干净的新闻)。
【文件预览】:
CrawlScript-bin
----crawlscript.jar(7.67MB)
----myjs()
--------corelib.js(1KB)
----demo.js(440B)
----download()
----scriptconfig.txt(15B)