XML之SAX解析模型

时间:2022-09-01 14:53:07

DOM解析会把整个XML文件全部映射成Document里的树形结构,当遇到比较大的文件时,它的内存占用很大,查找很慢

SAX就是针对这种情况出现的解决方案,SAX解析器会从XML文件的起始位置起进行解析,同时根据已经定义好的事件处理器,来决定当前所解析的部分是否有必要进行记录并存储

import java.io.File;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

public class SaxParser{
public static void main(){
      File xmlFile = new File("E:\\article.xml");
      SAXParserFactory factory = SAXParserFactory.newInstance();
      try{
             SAXParser parser = factory.newSAXParser();
             parser.parse(xmlFile,newMySaxHandler());
      }catch(Exception e){
             e.printstacktrace();
      }
}
}

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
public class MySaxHandler extends DefaultHandler{
      static DateFormat formater = newSimpleDateFormat("yyyy-MM-dd");
      private String content;

//覆写DefaultHandler中的charaters方法,接收元素中字符数据的通知,在执行完startElement或endElement方法后都会执行此操作
      @Override
      publicvoid charaters(char[] ch, int start, int length) throws SAXException{
             content = newString(ch,start,length);
      }
//当解析到元素的结束标签时触发
      @Override
      publicvoid endElement(String uri,String localName, String qName) throws SAXException{
      if("title".equals(qName))
             System.out.println("标题:"+ content);
      else if("author".equals(qName))
             System.out.println("作者:"+ content);
      else if("email".equals(qName))
             System.out.println("电子邮件:"+ content);
      else if("date".equals(qName))
             System.out.println("日期:"+ content);
      }
//当解析到元素的开始标签时触发
      @Override
      publicvoid startElement(String uri,String localName, String qName Attitudesattributes) throws SAXException{
             if("article".equals(qName)){
             System.out.println("所属分类:"+ attributes.getValue("category"));
             }
      }
}

DefaultHandler类

在解析XML数据时,要创建一个解析时的监听对象,一般可通过继承DefaultHandler类实现

void characters(char[] ch, int start, int length)

接收元素中字符数据的通知。

void endDocument()

接收文档结束的通知。

void endElement(String uri, String localName,String qName)

接收元素结束的通知。

void endPrefixMapping(String prefix)

接收名称空间映射结束的通知。

void error(SAXParseException e)

接收可恢复的解析器错误的通知。

void fatalError(SAXParseException e)

报告严重的 XML 解析错误。

void ignorableWhitespace(char[] ch, int start,int length)

接收元素内容中可忽略空白的通知。

void notationDecl(String name, StringpublicId, String systemId)

接收注释声明的通知。

void processingInstruction(String target,String data)

接收处理指令的通知。

InputSource resolveEntity(String publicId,String systemId)

解析外部实体。

void setDocumentLocator(Locator locator)

接收文档事件的 Locator 对象。

void skippedEntity(String name)

接收跳过的实体的通知。

void startDocument()

接收文档开始的通知。

void startElement(String uri, StringlocalName, String qName, Attributes attributes)

接收元素开始的通知。

uri - 名称空间 URI,如果元素没有任何名称空间URI,或者没有正在执行名称空间处理,则为空字符串。

localName - 本地名称(不带前缀),如果没有正在执行名称空间处理,则为空字符串。

qName - 限定的名称(带有前缀),如果限定的名称不可用,则为空字符串。

attributes - 附加到元素的属性。如果没有属性,则它将是空的 Attributes 对象。

void startPrefixMapping(String prefix, Stringuri)

接收名称空间映射开始的通知。

void unparsedEntityDecl(String name, StringpublicId, String systemId, String notationName)

接收未解析实体声明的通知。

void warning(SAXParseException e)

接收解析器警告的通知。

Attributes

int getIndex(String qName)

通过 XML 限定(前缀)名查找属性的索引。

int getIndex(String uri, String localName)

通过名称空间的名称查找属性的索引。

int getLength()

返回此列表中的属性个数。

String getLocalName(int index)

通过索引查找属性的本地名称。

String getQName(int index)

通过索引查找属性的 XML 限定(前缀)名。

String getType(int index)

通过索引查找属性的类型。

String getType(String qName)

通过 XML 限定(前缀)名查找属性的类型。

String getType(String uri, String localName)

根据名称空间的名称查找属性的类型。

String getURI(int index)

通过索引查找属性的名称空间 URI。

String getValue(int index)

通过索引查找属性的值。

String getValue(String qName)

通过 XML 限定(前缀)名查找属性的值。

String getValue(String uri, String localName)

根据名称空间的名称查找属性的值。

XML之SAX解析模型的更多相关文章

  1. xml的SAX解析和dom解析的区别

    一,区别 DOM解析 SAX解析 原理: 一次性加载xml文档,不适合大容量的文件读取 原理: 加载一点,读取一点,处理一点.适合大容量文件的读取 DOM解析可以任意进行增删改成 SAX解析只能读取 ...

  2. xml的SAX解析规则

    一,为什么要用它 1.1,讲解 DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树. 对内存要求比较要. 缺点: 不适合读取大容量的xml文件,容易导致内存溢出. SAX ...

  3. 【文件处理】xml 文件 SAX解析

    SAX的全称是Simple APIs for XML,也即XML简单应用程序接口. 与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式. 当使用SAX分析器对XML文档 ...

  4. Android解析XML之SAX解析器

    SAX(Simple API for XML)解析器是一种基于事件的解析器,它的核心是事件处理模式,主要是围绕着事件源以及事件处理器来工作的.当事件源产生事件后,调用事件处理器相应的处理方法,一个事件 ...

  5. xml——dom&sax解析、DTD&schema约束

    dom解析实例: 优点:增删改查一些元素等东西方便 缺点:内存消耗太大,如果文档太大,可能会导致内存溢出 sax解析: 优点:内存压力小 缺点:增删改比较复杂 当我们运行的java程序需要的内存比较大 ...

  6. 使用jaxp对比xml进行SAX解析

    package cn.itcast.sax; import java.io.IOException; import javax.xml.parsers.ParserConfigurationExcep ...

  7. XML之DOM解析模型

    <?xml version= "1.0" encoding = "UTF-8"> <articles> <article cate ...

  8. JavaWeb学习笔记——XML和SAX解析区别

  9. XML&period;03-DOM和SAX解析

    body,td { font-family: calibri; font-size: 10pt } XML.03-DOM和SAX解析 XML的DOM解析 解析 处理 回写 XML的SAX解析 SAX和 ...

随机推荐

  1. Kinect for Windows SDK开发入门&lpar;十九&rpar;:Kinect Fusion

        Kinect for Windows SDK1.7中引入了Kinect Fusion功能.在1.8的SDK中对该功能进行了改进和强化,Kinect Fusion能够使得我们使用Kinect f ...

  2. C&num; 检测网络链接

    ;//Local system uses a modem to connect to the Internet. ; //Local system uses a local area network ...

  3. eclipse项目持续报红解决

    1.tomcat 同步,点击publish: 2.clear项目 3.项目报红,Maven --->UpdateProject 4.pom.xml需要更新,下载最新jar包,附图:

  4. use python get information from one page

    #!/usr/bin/python read = file('thread-1554-1-1.html','r') wr = file('list','w') while 1: line=read.r ...

  5. BZOJ 2432 兔农

    Description 农夫栋栋近年收入不景气,正在他发愁如何能多赚点钱时,他听到隔壁的小朋友在讨论兔子繁殖的问题. 问题是这样的:第一个月初有一对刚出生的小兔子,经过两个月长大后,这对兔子从第三个月 ...

  6. Spark-用户应用程序入门

    /* 2 Spark Standalone模式下的Application Application是Spark中类似于Hadoop的Job的用户提交的应用.sc是Spark集群初始化时创建的SparkC ...

  7. GTK主题黑边问题

    Linux就是这样,上游一出点什么奇怪的变动,下游程序就要受影响..最近滚了一下后,不知道mesa还是xf86-intel-video哪个玩了什么新花样,所有gtk应用[主要是gnome组件]全部自带 ...

  8. C&num; 错误&colon;空对象不能转换为值类型

    最近在做项目的时候出现了一个错误 当从数据库中获取值的时候 报错:空对象不能转换为值类型 因为数据库你查询数据的时候不是所有的字段都是存在数据的,有些字段可能是Null值,也就是没有数据 当你在类型转 ...

  9. DotNet进阶系列

    一. 回顾历史 回顾个人发展历程,自2012年初次接触开发至今(2018年)已经有六个年头,这期间陆陆续续学习并掌握了不少技术,C#语言.ORM框架.多线程技术.设计模式.前端技术.MVC.MVVM框 ...

  10. Delphi---TServerSocket和TClientSocket发送和接收大数据包

    https://www.cnblogs.com/zhangzhifeng/p/6065244.html TServerSocket和TClientSocket用非阻塞模式发送和接收比较大的数据时,可能 ...