DOM方式解析XML的过程为首先将所有 XML 文档读取到内存中,构造一个树结构,然后允许使用 DOM API 来操作整个树结构,包括遍历 XML 树、检索所需的数据等。
Android平台使用Java SDK中的API来实现DOM方式的解析,具体的方法和之前学习的使用Java SDK中的SAX方式解析XML类似,因此有了前面SAX的基础,学习DOM方式就会比较简单了。DOM 和 之前的SAX 的主要差别是 API 本身的结构,SAX 由基于事件的回调集组成,边解析边产生事件从而调用事件处理器的回调函数进行处理。而DOM不是,DOM直接读取整个XML树保存为Document类,因此只需处理保存在内存中的Document对象即可,没有回调函数。
DOM解析相关的包为javax.xml.parsers和org.w3c.dom。其中javax.xml.parsers提供Document构造器工厂DocumentBuilderFactory和Document构造器DocumentBuilder,DocumentBuilderFactory实例调用newDocumentBuilder()创建构造器DocumentBuilder实例,然后该实例就可以调用parse方法来返回一个解析为Document类的实例。Document 类由表示XML文档的包含元素、属性、文本内容等的各个节点组成。因此有了Document对象后就可以按需要获取xml文档中各个子节点及其相关的值了。Document、Element、Node等各个和DOM相关的具体部分都在org.w3c.dom包中,因此和SAX类似,org.w3c.dom包是底层具体的负责DOM解析相关的内容,并且为上层javax.xml.parsers包提供DOM解析器等相关调用。
DOM解析过程:
1、构造DocumentBuilder解析器
2、传入xml文件输入流,解析xml文件,返回文档对象
3、根据文档对象,从内存中检索数据。
下面依旧解析这个简单的xml文件 test.xml
<?xml version="1.0" encoding="UTF-8"?>
<persons>
<person id="1">
<name>Lucy</name>
<age>15</age>
</person>
<person id="2">
<name>Tim</name>
<age>20</age>
</person>
</persons>
public void domParseXml() throws ParserConfigurationException, SAXException, IOException {
// 构造DocumentBuilder解析器
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = builderFactory.newDocumentBuilder();
// 获得xml文件的输入流,获得文档对象
InputStream inputStream = getClass().getClassLoader().getResourceAsStream("test.xml");
Document document = dBuilder.parse(inputStream);
// 解析完成,根据document从内存中检索数据
Element root = document.getDocumentElement();// 获取文档根节点(xml文件只允许一个根节点)
NodeList personsNode = root.getElementsByTagName("person");// 取得所有person节点的列表
// NodeList personsNode=root.getChildNodes();上一步取得person节点,不能这个方法,是因为子节点包括元素节点和文本节点,如果用这个方法,还要判断取得的节点的类型
List<Person> persons=new ArrayList<Person>();
for (int i = 0; i < personsNode.getLength(); i++) {
Person person=new Person();
Element personElement = (Element) personsNode.item(i);//开始解析取得的person节点
int id = new Integer(personElement.getAttribute("id"));//取得person节点的属性 id
person.setId(id);
NodeList childsNode = personElement.getChildNodes(); //取得person节点的所有子节点
for (int j = 0; j < childsNode.getLength(); j++) {
if (childsNode.item(j).getNodeType() == Node.ELEMENT_NODE) {//如果子节点是元素节点
Element childElement = (Element) childsNode.item(j);//取得这个元素节点
if (childElement.getNodeName().equals("name")) {//判断是哪一个元素节点
person.setName(childElement.getFirstChild().getNodeValue());//获得元素节点的第一个子节点的值
}
if (childElement.getNodeName().equals("age")) {
person.setAge(new Integer(childElement.getFirstChild().getNodeValue()));
}
}
}
persons.add(person);
person=null;
}
for (Person p : persons) {
System.out.println(p.getId() + "--" + p.getName() + "---" + p.getAge());
}
}
DOM解析技术虽然比较直观,但是需要装在真个xml文档,内存消耗大,所以使用较少。