文件名称:自己用java做的一个类似网页爬虫的东西
文件大小:765KB
文件格式:RAR
更新时间:2009-03-16 05:05:32
java Java小程序 爬虫 网页爬虫
能实现整个网站的抓取,暂时还不支持javascript形式的连接 能抓取网页,网页中的所有的URL重新生成,图片,文件,包括所有格式的文件,全部都能保持原有的路径结构 抓取下的网页,通过apache搭建成网站,能在本地保持成一个完整的网站的形式 能直接使用,也能支持二次开发使用,不过暂时还会存在比较多的不完善的地方. 提供内置线程,能控制抓取操作执行的时间,循环执行 东西还不是很完善,欢迎大家提出意见