【文件属性】:
文件名称:Java网络爬虫代码
文件大小:11KB
文件格式:RAR
更新时间:2014-10-28 14:50:40
Java网络爬虫代码
* Crawl website(开始抓取网站的内容)
* @param startUrl----The first URL crawled,actually is the website's url
* (第一个要抓取的链接,实际上就是网站的地址)
* @param maxUrls----The max number of crawled URL(要抓取内容的链接数的最大值)
* @param limithost----Whether limited host(是否限制主机的参数,true限制,false不限制)
【文件预览】:
Java网络爬虫.doc
网友评论
- 或许这并不是我想要的,不过还是谢谢作者
- 就是感觉貌似缺了东西
- 还不错,只不过没有用到爬虫的一些框架
- 还不错,有些还需要改进