一个用java实现的抓取网站程序

时间:2013-09-02 04:40:22
【文件属性】:

文件名称:一个用java实现的抓取网站程序

文件大小:9KB

文件格式:RAR

更新时间:2013-09-02 04:40:22

java 抓取 spider

一个用java实现的抓取网站程序,使用了多线程抓取,对html分析程序和防屏蔽功能实现


【文件预览】:
crawler
----SimpleHTMLParser.java(5KB)
----PageInfo.java(4KB)
----WebPageXtractor.java(4KB)
----Arachnid.java(6KB)
----SimpleHTMLToken.java(2KB)

网友评论

  • 例子很简单明了