Java网络爬虫代码

时间:2014-10-28 14:50:40
【文件属性】:

文件名称:Java网络爬虫代码

文件大小:11KB

文件格式:RAR

更新时间:2014-10-28 14:50:40

Java网络爬虫代码

* Crawl website(开始抓取网站的内容) * @param startUrl----The first URL crawled,actually is the website's url * (第一个要抓取的链接,实际上就是网站的地址) * @param maxUrls----The max number of crawled URL(要抓取内容的链接数的最大值) * @param limithost----Whether limited host(是否限制主机的参数,true限制,false不限制)


【文件预览】:
Java网络爬虫.doc

网友评论

  • 或许这并不是我想要的,不过还是谢谢作者
  • 就是感觉貌似缺了东西
  • 还不错,只不过没有用到爬虫的一些框架
  • 还不错,有些还需要改进