java爬虫程序

时间:2010-09-22 16:14:47
【文件属性】:

文件名称:java爬虫程序

文件大小:22KB

文件格式:ZIP

更新时间:2010-09-22 16:14:47

java 搜索 爬虫 蜘蛛

Arachnid:是一个基于Java的web spider框架.它包含一个简单的HTML剖析器能够分析包含HTML内容的输入流.通过实现Arachnid的子类就能够开发一个简单的Web spiders并能够在Web站上的每个页面被解析之后增加几行代码调用。


【文件预览】:
GetGraphics.java
GPL.txt
ServerStressTest.java
build.xml
bplatt
----spider()
--------PageInfo.java(4KB)
--------SimpleHTMLToken.java(2KB)
--------SimpleHTMLParser.java(5KB)
--------Arachnid.java(6KB)
--------WebPageXtractor.java(4KB)
SimpleSiteMapGen.java
Arachnid.html
readme.txt

网友评论

  • 正在学习研究中,谢谢lz分享
  • 代码好像有问题,不能用
  • 资源不错,值得下载
  • 不错的资源。正在学习
  • 请问在myeclipse中怎么运行啊?
  • 学问太浅 看的不是很懂
  • 正在研究学习中,可用。
  • 嗯,还是可以用的,不过一开始读懂有点难
  • 正在学习研究中,谢谢分享
  • 正在研究学习中,可用。
  • 代码好像有问题,不能用
  • 代码好像有问题,不能用
  • 正在研究学习中,谢谢分享!
  • 不错的资源,学习中
  • 看了一会看懂了,还是不错的
  • 不错的资源,挺好用的
  • 不错的程序源码,很实用。
  • 很棒的,值得学习
  • 很有帮助,感谢楼主分享
  • 正在学习 感谢楼主
  • 研究学习中,谢谢分享
  • 看了半天才看懂,其他的爬虫我都没看懂,很好很实用
  • 程序很小,但是很实用
  • 看了半天才看懂,其他的爬虫我都没看懂,很好很实用
  • 很实用,完成个人爬虫程序,谢谢分享
  • 程序很小,但是很实用
  • 程序很小,但是很实用
  • 正在学习中... ... 注释多点就更好了
  • 目前正在研究heritrix 。这个也能够帮我分析原理。谢谢分享
  • 自己修改了一些东西,挺好用的