网络蜘蛛spider crawl

时间:2011-06-24 06:50:25
【文件属性】:

文件名称:网络蜘蛛spider crawl

文件大小:11KB

文件格式:RAR

更新时间:2011-06-24 06:50:25

java spider 源代码 网络爬虫 网络蜘蛛

用Java写的网络蜘蛛,可以抓取网站URL列表,并分词站内外列表。有清晰的注释,和大家一同学习


【文件预览】:
网络蜘蛛
----webcraker.jar(12KB)
----read me.txt(66B)
----源文件()
--------WebCrawler.java(19KB)

网友评论

  • 不是我想要的,我不想要swing写的框架,我想要个纯java原理的爬虫程序,但总体说写的不错!
  • 形式还不错,有一个源代码文件,有一个可执行文件,还有一个小说明。可是从功能上,只有网址列表,没有内容提取……都不知道要来有什么用……
  • 代码写的很清晰,确实可以爬出相应网络列表,但我需要更具体的网页信息爬取,继续学习。