浅谈用java解析xml文档（二）

　　　　上一文中总结了dom解析xml文档的方式，本文开始总结使用SAX解析xml 的方式及它的优缺点！

　　　　SAX(Simple API for XML),是指一种接口，或者一个软件包.

　　　　首先我们应该知道SAX解析和dom解析的区别：

　　　　dom是树结构解析，易于理解和开发，它可以随意访问文件所在的节点位置，易于修改，删除和查询。但对于dom文档过大时，则会解析较慢。

　　　　而SAX解析是事件推动型，顺序读取文件的节点，且只能读取文档的内容，不能对文档的内容进行修噶，对文档的大小没有过多的限制，但开大复杂度较高，

　　　　下面介绍一个SAX解析xml文档的几个关键步骤：

　　　　　（1）、创建XML解析处理器，即SAXParseFactory 的实例，

　　　　　　　　SAXParserFactory factory = SAXParserFactory.newInstance();

　　（2）、通过factory创建SAX解析器

　　　　　　　　SAXParser parser = factory.newSAXParser();

　　　　（3）、通过SAXParse 的实例，创建xml解析处理器。对文档进行解析，

　　　　　　　　parser.parse(uri,handler) 方法有两个参数uri ， handler对象，uri就是我们的文档的路径，

　　　　　　　　接下来我们需要创建一个handler对象，我们创建一个Myhandler类，这个Myhandler类需要继承DefaultHandler类，

　　　　　　　　Myhandler handler = new Myhandler();

　　　　下面是我们的Myhandler的实例代码。

　 1 package com.imooc.handler;

 import org.xml.sax.Attributes;

 import org.xml.sax.SAXException;

 import org.xml.sax.helpers.DefaultHandler;

 /*

  * 解析xml处理器

  *

  * */

 public class Myhandler extends DefaultHandler{

     String value = null;

     /**

      * 用来标识解析开始

      */

     @Override

     public void startDocument() throws SAXException {

         // TODO Auto-generated method stub

         super.startDocument();

         System.out.println("SAX解析开始");

     }

     /**

      * 用来标识解析结束

      */

     @Override

     public void endDocument() throws SAXException {

         // TODO Auto-generated method stub

         super.endDocument();

         System.out.println("SAX解析结束");

     }

     /**

      * 解析xml元素

      */

     @Override

     public void startElement(String uri, String localName, String qName,

             Attributes attributes) throws SAXException {

         // TODO Auto-generated method stub

         super.startElement(uri, localName, qName, attributes);

         if (qName.equals("book")) {

             int num = attributes.getLength();

             for(int i = 0; i < num; i++){

                 System.out.print("book元素的第" + (i + 1) +  "个属性名是："

                     + attributes.getQName(i));

                 System.out.println("---属性值是：" + attributes.getValue(i));

             }

         }else if (!qName.equals("name") && !qName.equals("bookstore")) {

             System.out.print("节点名是：" + qName + "---");

         }

     }

     @Override

     public void endElement(String uri, String localName, String qName)

             throws SAXException {

         // TODO Auto-generated method stub

         super.endElement(uri, localName, qName);

     }

     @Override

     public void characters(char[] ch, int start, int length)

             throws SAXException {

         // TODO Auto-generated method stub

         super.characters(ch, start, length);

         value = new String(ch, start, length);

         if (!value.trim().equals("")) {

             System.out.println("节点值是：" + value);

         }

     }

 }

　　　　　　（4）、测试主程序入口

 public static void main(String[] args) {

         SAXParserFactory factory = SAXParserFactory.newInstance();

         try {

             SAXParser parser = factory.newSAXParser();    

             Myhandler handler = new Myhandler();

             parser.parse("books.xml", handler);

         } catch (ParserConfigurationException e) {

             // TODO Auto-generated catch block

             e.printStackTrace();

         } catch (SAXException e) {

             // TODO Auto-generated catch block

             e.printStackTrace();

         } catch (IOException e) {

             // TODO Auto-generated catch block

             e.printStackTrace();

         }

     }

　　　　books.xml文件，

 <?xml version="1.0" encoding="UTF-8"?>

 <bookstore>

     <book id="1">

         <name>老人与海</name>

         <author>海明威</author>

         <year>1955</year>

         <price>45</price>

     </book>

     <book id="2">

         <name>书剑恩仇录</name>

         <year>1959</year>

         <price>24</price>

         <language>chinese</language>

     </book>

 </bookstore>

输出的结果为：

SAX解析开始

book元素的第1个属性名是：id---属性值是：1

节点值是：老人与海

节点名是：author---节点值是：海明威

节点名是：year---节点值是：1955

节点名是：price---节点值是：45

book元素的第1个属性名是：id---属性值是：2

节点值是：书剑恩仇录

节点名是：year---节点值是：1959

节点名是：price---节点值是：24

节点名是：language---节点值是：chinese

SAX解析结束

　　　　这样我们就完成了最基本的SAX解析xml文档。

　　　　总结：

　　　　优点：对内存要求比较低，对文档中的部分数据来进行解析开发速度快，而且扩展能力强。

　　　　缺点：用SAX方式进行XML解析时,需要顺序执行,所以很难访问到同一文档中的不同数据.此外,在基于该方式的解析编码过程也相对复杂

秒客网

浅谈用java解析xml文档（二）

相关文章