文件名称:使用 HttpClient 和 HtmlParser 实现简易爬虫
文件大小:215KB
文件格式:DOC
更新时间:2015-08-02 04:09:05
简易爬虫java
这篇文章介绍了 HtmlParser 开源包和 HttpClient 开源包的使用,在此基础上实现了一个简易的网络爬虫 (Crawler),来说明如何使用 HtmlParser 根据需要处理 Internet 上的网页,以及如何使用 HttpClient 来简化 Get 和 Post 请求操作,构建强大的网络应用程序。