自己用java做的一个类似网页爬虫的东西

时间:2009-03-16 05:05:32
【文件属性】:

文件名称:自己用java做的一个类似网页爬虫的东西

文件大小:765KB

文件格式:RAR

更新时间:2009-03-16 05:05:32

java Java小程序 爬虫 网页爬虫

能实现整个网站的抓取,暂时还不支持javascript形式的连接 能抓取网页,网页中的所有的URL重新生成,图片,文件,包括所有格式的文件,全部都能保持原有的路径结构 抓取下的网页,通过apache搭建成网站,能在本地保持成一个完整的网站的形式 能直接使用,也能支持二次开发使用,不过暂时还会存在比较多的不完善的地方. 提供内置线程,能控制抓取操作执行的时间,循环执行 东西还不是很完善,欢迎大家提出意见


网友评论

  • 不能使用啊
  • 不错,根据自己的实际情况再稍加修改就可以用了。
  • 存在乱码问题,撮合能用。
  • 代码很乱。。都是html文件。。我都不知道怎么下手。。
  • 好不错,可以参考
  • 可能是我基础比较差,看不太懂
  • 有问题,不能使用
  • 用起来好像很复杂的额样子
  • 可能是我基础比较差,看不太懂
  • 楼主需要重新编写,貌似不能使用好像不能使用。
  • 下载的文件有点乱,不满足需求。谢谢
  • 下载的文件有点乱,不满足需求。 谢谢
  • 的吧,, 全是html文件。。。。 怎么2次开发啊?
  • 貌似不能用
  • 用起来好像很复杂,java编写的
  • 貌似有问题啊。。
  • 貌似有问题,不能使用
  • 用起来好像很复杂的额样子
  • 能下载好多文件,但是不能连接起来
  • 假 的吧,, 全是html文件。。。。 怎么2次开发啊?