使用JSoup实现新闻网页正文抽取

时间:2014-11-09 10:28:08
【文件属性】:

文件名称:使用JSoup实现新闻网页正文抽取

文件大小:9KB

文件格式:RAR

更新时间:2014-11-09 10:28:08

JSoup 新闻网页正文抽取

本程序用用解析工具JSoup,编程实现了新闻网页正文信息抽取,适用于新浪163qq等新闻网页信息抽取。开发工具为Eclipse,将工程导入到Eclipse后,直接运行NewsDown.java类。


【文件预览】:
NewsExtract
----src()
--------NewsDown.java(3KB)
--------NewsExtractor.java(3KB)
--------StringQuery.java(406B)
--------TestQuery.java(326B)
----bin()
--------NewsDown.class(4KB)
--------NewsExtractor.class(4KB)
--------TestQuery.class(803B)
--------StringQuery.class(869B)
----.classpath(358B)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----.project(387B)

网友评论

  • 不错的分享,针对新闻网页
  • 很不错的例子,爬取网页新闻,不过有点局限性
  • 很好的分享 有用
  • 不错的例子,感谢分享
  • 例子挺好的
  • 不错,不过是依新闻为例的,面对所有网页还不能称得上是通用,需待改进。
  • 东西真的很好用。谢谢楼主的分享
  • 很不错,已经可以运行
  • 可以用,感谢分享
  • 不错的例子。
  • 好像还是达不到我要的效果,不过还是谢谢啦
  • 有局限性 但是还是不错
  • 很好很实用
  • 有局限性 但是还是不错
  • 很好 不过看不太懂
  • 啥也不说了,满分刚刚的
  • jsoup解析数据,还不错
  • 写得非常好,解决了我的一些小问题
  • 不错的例子
  • 抓取的规则还是有点简单,还行。
  • 导入到eclipse里面,然后导入jsoup.jar就可以运行了。。。但是还是怪怪的,显示结果特别混乱。。。
  • 虽然 有局限性 但是还是不错 顶了
  • 最近在学这个~很有用的小例子~
  • 确实可以使用。
  • 代码很有用,谢谢了
  • jsoup解析数据,还不错
  • 刚刚好适合我,不过没有判断是否是广告的方法
  • 很不错的例子,正是我想找的。。不错
  • 不错,抓取规则有点简单
  • 代码可以跑通,不错