网页正文提取 jsoup实现

时间:2013-12-30 07:58:23
【文件属性】:

文件名称:网页正文提取 jsoup实现

文件大小:75KB

文件格式:RAR

更新时间:2013-12-30 07:58:23

网页正文 swing界面

linklist.java是入口函数,有界面,我自己用JSOUP实现的网页正文提取。


【文件预览】:
jsoup
----Jsoup.java(7KB)
----helper()
--------DataUtil.java(4KB)
--------StringUtil.java(4KB)
--------Validate.java(2KB)
--------HttpConnection.java(19KB)
----examples()
--------ListLinks.form(5KB)
--------ListLinks.java(14KB)
--------package-info.java(145B)
----parser()
--------package-info.java(101B)
--------Tag.java(18KB)
--------TokenQueue.java(12KB)
--------Parser.java(11KB)
----package-info.java(145B)
----safety()
--------Whitelist.java(15KB)
--------package-info.java(95B)
--------Cleaner.java(5KB)
----nodes()
--------Evaluator.java(7KB)
--------DataNode.java(1KB)
--------Element.java(36KB)
--------Entities.java(75KB)
--------Attribute.java(3KB)
--------Document.java(9KB)
--------package-info.java(64B)
--------XmlDeclaration.java(1KB)
--------TextNode.java(4KB)
--------Attributes.java(6KB)
--------Comment.java(1KB)
--------Node.java(13KB)
----Connection.java(11KB)
----select()
--------package-info.java(86B)
--------NodeVisitor.java(212B)
--------Elements.java(14KB)
--------Selector.java(18KB)
--------Collector.java(1KB)
--------NodeTraversor.java(931B)

网友评论

  • 对我没什么用,没有注释
  • 程序可以运行,可以用作参考例子!
  • 没什么用阿
  • 还好 对我有点用
  • 可以用 有一定参考价值
  • 值得参考的资料
  • 还不错,jsoup一直在更新,算是比较主流的解析工具,这个资源里代码可读性较强,适合入门。
  • 不错的资源,可以用来参考
  • 很不错的东西,唯一的缺点是,里面大部分是jsoup jar包的源码,所以里面的很多包都可以用jsoup jar包替换
  • 还好吧,也算是个入门的例子
  • 一开始不太会用,不过后来研究了下API,发现东西不错!赞一个~
  • 内容太多,看着有点昏
  • 代码可以跑通,不错。谢谢分享。
  • 感谢分享吧,自己没能实现。
  • 内容太多了,还不能用。
  • 谢谢分享,内容有点多。
  • 放到了环境中,但是不会用,谢谢上传者
  • 谢谢分享,内容比较多