Android Jsoup解析HTML部署与使用

时间:2022-11-01 09:22:06

Jsoup Cookbook(中文版)

入门

  1. 解析和遍历一个html文档

输入

  1. 解析一个html字符串
  2. 解析一个body片断
  3. 根据一个url加载Document对象
  4. 根据一个文件加载Document对象

数据抽取

  1. 使用dom方法来遍历一个Document对象
  2. 使用选择器语法来查找元素
  3. 从元素集合抽取属性、文本和html内容
  4. URL处理
  5. 程序示例:获取所有链接

数据修改

  1. 设置属性值
  2. 设置元素的html内容
  3. 设置元素的文本内容

html清理

  1. 消除不受信任的html (来防止xss攻击)


下载:

jsoup-1.8.3.jar core library http://jsoup.org/packages/jsoup-1.8.3.jar
jsoup-1.8.3-sources.jar optional sources jar http://jsoup.org/packages/jsoup-1.8.3-sources.jar
jsoup-1.8.3-javadoc.jar optional javadoc jar http://jsoup.org/packages/jsoup-1.8.3-javadoc.jar


Maven:

<dependency>
<!-- jsoup HTML parser library @ http://jsoup.org/ -->
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.8.3</version>
</dependency>

Gradle:

dependencies {
...
compile 'org.jsoup:jsoup:1.8.3'
}