【文件属性】:
文件名称:自己用java做的一个类似网页爬虫的东西
文件大小:765KB
文件格式:RAR
更新时间:2009-03-16 05:05:32
java Java小程序 爬虫 网页爬虫
能实现整个网站的抓取,暂时还不支持javascript形式的连接
能抓取网页,网页中的所有的URL重新生成,图片,文件,包括所有格式的文件,全部都能保持原有的路径结构
抓取下的网页,通过apache搭建成网站,能在本地保持成一个完整的网站的形式
能直接使用,也能支持二次开发使用,不过暂时还会存在比较多的不完善的地方.
提供内置线程,能控制抓取操作执行的时间,循环执行
东西还不是很完善,欢迎大家提出意见
网友评论
- 不能使用啊
- 不错,根据自己的实际情况再稍加修改就可以用了。
- 存在乱码问题,撮合能用。
- 代码很乱。。都是html文件。。我都不知道怎么下手。。
- 好不错,可以参考
- 可能是我基础比较差,看不太懂
- 有问题,不能使用
- 用起来好像很复杂的额样子
- 可能是我基础比较差,看不太懂
- 楼主需要重新编写,貌似不能使用好像不能使用。
- 下载的文件有点乱,不满足需求。谢谢
- 下载的文件有点乱,不满足需求。 谢谢
- 的吧,, 全是html文件。。。。 怎么2次开发啊?
- 貌似不能用
- 用起来好像很复杂,java编写的
- 貌似有问题啊。。
- 貌似有问题,不能使用
- 用起来好像很复杂的额样子
- 能下载好多文件,但是不能连接起来
- 假 的吧,, 全是html文件。。。。 怎么2次开发啊?