java基础之概谈xml文件解析

时间:2024-01-12 18:29:44

XML已经成为一种非常通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。

诸多web应用框架,其可配置的编程方式,给我们的开发带来了非常大程度的便捷,但细细想来,它们的应用无一不是java
bean与xml之间的转换解析。本文将对xml的两种操作标准DOM和SAX,从它们各自的特点、适用范围等方面进行简介。

DOM (Document Object Model) :DOM标准中,採用W3C标准表示XML,有多重语言支持。因此其跨平台性非常好。

採用DOM规范处理xml时,会把xml文件总体载入进内存中,并在内存中建立对象树。对象树表示为Document对象,xml文件的根节点相应对象树的根节点。依次往下排列。由于整个xml文件被载入至内存中,所以基于DOM的处理对server内存要求比較高。可是正由于整个文件被载入,所以对文件本身的操作速度会比較快。注意这里所说的是文件本身,即文件被载入后的处理,比方对文件内部元素的遍历。但当文件本身非常大时。由于载入速度及对内存的占用影响,因此从总体而言。其效率不一定好。

适用范围:小型 XML 文件解析、须要全解析或者大部分解析 XML、须要改动 XML 树内容以生成自己的对象模型

使用DOM解析xml文件的步骤:

1.获取DocumentBuilderFactory对象。

2.使用DocumentBuilderFactory对象生成DocumentBuilder对象。

3.使用DocumentBuilder对象解析xml文件得到Document对象。

4.从Document对象获得xml文件根节点。

5.通过Node节点出发获得文档信息。

SAX (Simple API for XML) :SAX规范把xml文件作为数据流来处理的,读取一部分数据。处理一部分数据,它不须要将整个文件载入进内存。因此它非常好的攻克了DOM解析中资源占用的问题。SAX规范是基于事件驱动的。将XML数据文件里的不同内容归纳为不同的对象,解析不同对象时会产生不同事件,进而调用不同事件处理器。比方在開始解析文件时会产生文件解析事件,调用startDocument事件处理器;当读取节点的时候会产生開始元素事件,调用startElement事件处理器。相同。当读取节点内容、节点解析结束、文件解析结束时,会产生相应事件,调用相应的文件处理器进行处理。

适用范围:大型 XML 文件解析、仅仅须要部分解析或者仅仅想取得部分 XML 树内容、有 XPath 查询需求、有自己生成特定 XML 树对象模型的需求

使用SAX方式解析xml文档的步骤:

1.获取SAXParserFactory对象;

2.使用SAXParserFactory对象生成SAXParser。

3.调用SAXParser对象的parser方法对xml解析,然后获取解析结果。