XML文档的解析—dom4j

时间:2023-03-09 09:32:13
XML文档的解析—dom4j

XML为可扩展标记语言,它主要是用来保存数据,做配置文件,数据传输载体等。其实就是一个后缀名为.xml的文件。

XML命名规则

  • 名称可以含字母、数字以及其他的字符
  • 名称不能以数字或者标点符号开始
  • 名称不能以字符 “xml”(或者 XML、Xml)开始
  • 名称不能包含空格

文档声明

例如此声明:<?xml version="1.0" encoding="gbk" standalone="no" ?>

(1)version : 解析这个xml的时候,使用什么版本的解析器解析

(2)encoding : 解析xml中的文字的时候,使用什么编码来翻译

(3)standalone:no - 该文档会依赖关联其他文档 ,  yes-- 这是一个独立的文档

注意:保存XML文件使用的编码格式与encoding定义的编码格式需一致,否则显示中文时会发生乱码,推荐使用UTF-8编码格式保存文档。

文档结构说明

根元素(rootElement):文档声明下来的第一个元素;

子元素(Element):除根元素的其他元素;

属性(Attribute)的定义:定义在元素里面, <元素名称 属性名称="属性的值"></元素名称>。

 <?xml version="1.0" encoding="UTF-8"?>
<students>
<fristStu id="firstName">
<name>张三</name>
<age>20</age>
<address>北京海淀</address>
</fristStu>
<secondStu id="secondName">
<name>Toma</name>
<age>20</age>
<address>湖北武汉</address>
</secondStu>
</students>

XML解析

获取元素里面的字符数据或者属性数据。XML解析方式有多种,常用的有两种:

  • DOM:可对文档进行增删操作,读取整个文档至内存中,XML过大,内存溢出;
  • SAX:读取一行,解析一行,不会造成内存溢出,但不可以增删操作,只能查询;
  • 最常用的解析方案为dom4j。

使用dom4j解析XML

  1. 创建SAXReader对象;

  2. 指定解析的XML;

  3. 获取根元素;

  4. 根据根元素获取子元素或者下面的子孙元素。

注意:在进行解析之前,需要导入dom4j的jar包,以eclipse为例:右击项目名称—>Build Path—>Configure Build Path....—>点击右侧的Add External JARs...—>选择下载好的dom4j的jar包—>Apply and Close。

java代码如下:

 package com.reedeek.dom4j;

 import java.io.File;
import java.util.List; import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader; public class dom4j_XML { public static void main(String[] args) {
/**
* XML解析方式有多种,常用的有两种:
* 1、DOM:可对文档进行增删操作,读取整个文档至内存中,XML过大,内存溢出;
* 2、SAX:读取一行,解析一行,不会造成内存溢出,但不可以增删操作,只能查询。
* 3、最常用的解析方案为dom4j;
*
*/
try {
// 创建SAXReader对象
SAXReader sax = new SAXReader();
// 指定解析的xml文件地址
Document document = sax.read(new File("src/xml/students.xml"));
// 获取根元素
Element rootElement=document.getRootElement();
// 获取子元素集
List<Element> elements=rootElement.elements();
for(Element element:elements) {
System.out.print(element.getName()+": ");
String name=element.element("name").getText();
String age=element.element("age").getText();
String address=element.element("address").getText();
System.out.println(name+" "+age+" "+address);
}
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} } }

运行测试结果:

XML文档的解析—dom4j