文件名称:Java网络爬虫代码
文件大小:11KB
文件格式:RAR
更新时间:2014-10-28 14:50:40
Java网络爬虫代码
* Crawl website(开始抓取网站的内容) * @param startUrl----The first URL crawled,actually is the website's url * (第一个要抓取的链接,实际上就是网站的地址) * @param maxUrls----The max number of crawled URL(要抓取内容的链接数的最大值) * @param limithost----Whether limited host(是否限制主机的参数,true限制,false不限制)
【文件预览】:
Java网络爬虫.doc