java解析网页内容

时间:2015-08-27 14:30:51
【文件属性】:

文件名称:java解析网页内容

文件大小:8KB

文件格式:RAR

更新时间:2015-08-27 14:30:51

java htmlParser 抓取网页内容 数据库

改程序利用htmlParser这个jar包实现了对网页的解析,实现了对网址,网页的标题,网页上的图片,网页的内容的额入库操作。使用mySQL数据库。但是,在网页内容的提取方面还有很多的问题,毕竟各个网页的风格不一样,所以大家可以根据自己的需要做一下修改。但是最大的问题还是在于目前的技术解决不了动态网页的解析问题。其实严格来说是可以解决的,只是太难了,相当于编写一个浏览器,大家应该用过浏览器的审查元素的功能,里面可以查看动态元素的源码,就是这个道理。我的另外一个思路是,将网页保存到本地,这时用记事本打开可以看到动态的源码,然后解析即可,但是目前程序还没有实现这一功能,希望有想法的可以和我交流一下经验。


【文件预览】:
MyHtmlParser
----src()
--------HtmlParser.java(6KB)
----bin()
--------HtmlParser.class(8KB)
--------HtmlParser$1.class(960B)
--------HtmlParser$2.class(972B)
----.classpath(531B)
----.settings()
--------org.eclipse.jdt.core.prefs(598B)
----.project(388B)

网友评论

  • 可以用,谢谢分享
  • 虽然有很多不同的情况,但也是起到了一定的借鉴作用
  • 万能的java,这个东西真的不错,多谢
  • 最近想解析网上的词典。希望有帮助
  • 毕设参考资料,有点帮助
  • 不能用,导入htmlparser.jar和mysql的jar包,异常乱飘
  • 资源很好,谢谢分享
  • 在网页内容的提取方面有很多的问题 其实没多大用处
  • 资源很好,但数据库用的不是MySQL
  • 太好了,有现成的可以看
  • 是一个htmlparser jar包,挺好的DDW
  • 我下载下来后,导入失败啊
  • 是一个htmlparser jar包,挺好的
  • 挺好的学习事例
  • 好的学习事例,可以研究下
  • 挺好的学习事例,可以研究下,谢谢了
  • 挺好的学习事例
  • 挺好的学习事例,可以研究下
  • 挺好的学习实例,谢谢分享
  • 挺好的学习事例。
  • 楼主的这个简单的页面解析程序挺实用的,谢谢分享