文件名称:网络爬虫源码
文件大小:26.05MB
文件格式:7Z
更新时间:2015-06-06 08:57:33
网络爬虫 源码
使用HttpClient,HttpParser,开发的一个网络爬虫。记住要使用jdk1.5以上版本
【文件预览】:
爬虫和索引工具
----conf()
--------urlfilter.txt(54B)
----新建文本文档.txt(179B)
----CrawlIndex.jar(29.34MB)
----indexs()
--------index()
--------crawlDB()
--------segments()
--------webs()
----url.txt(988B)