java 面向对象编程 第20章 XML技术解析

时间:2021-04-25 07:40:39

1、  XML:extended Markup Language  可扩展标记语言,利用标签和子标签方式描述数据。

2、  声明<?xml version=”1.0”?>版本号

注释<!--    -->

空元素:<x/>标签之间没有内容

3、  每个XML文档必须有且只有一个根元素;根元素是一个完全包括文档中其它所有元素的元素;所有的元素都必须在根元素中定义。

4、  实体在XML中是存储单元,,一个实体可以包含字符串、文件、数据库记录,以及一些其它数据。预定义的符号:“<”“””“>”,在XML文档中使用预定义的实体来代替,书上P527。

5、  CDATA是不被解析器解析的文本。文本内的标签不会被当作标记,实体不会被展开。语法:<![CDATA[ …..  ]]>

6、  XML文档必须是格式良好的(Well-formed):满足XML基本的语法规则。如果XML文档不是格式良好的,就不能被应用程序和浏览器正确识别和解析。

7、  语法规范:

a)         必须有XML声明语句;<?xml version=”1.0”?>

b)         必须有且仅有一个根元素;

c)         标记大小写敏感;

d)         属性值用双引号或单引号;

e)         标记成对;

f)          空标记关闭

g)         元素正确嵌套

8、  有效的XML除了要满足XML规范外,还要满足相应DTD和Schema定义的元素规则;有效的XML一定是格式良好的,但格式良好的XML不一定是有效的。

9、  DOM解析:基于树状结构的API;整个XML文档必须在内存中解析和存储;客户端应用程序可以随机访问这些对象;大型文档则会造成内存紧张。

10、              SAX提供一种用于解析XML文档的事件驱动模型;使用回调机制将事件通知应用程序;特点:不必将整个文件加载到内存中,占用的内存少;不能对文档进行随机访问;SAX是只读的;文档只能遍历一次。