XML学习笔记3——XSD简述

时间:2023-03-08 16:36:11

  现在的语言,如果不有那么一点OO的影子,都不好意思称之为语言了。在XML的语义约束方面,DTD虽然简单,但是功能不够强大,完全是直白的描述,于是又有了替代DTD的XSD(XML Schema Definition),XSD引入了数据类型,提供了自定义数据类型的各种机制,甚至还能找到继承、多态等各种OO特征,然而学习起来也就相对复杂了,从这篇笔记开始学习一下XSD。

1、XSD文件是一种XML文件

  XSD文件是一种XML文件,满足所有XML文件格式的一切要求,比如有且仅有一个根元素(这个根元素就是<schema/>),所有对XML文件有效的技术对XSD文件也同样有效,包括使用XSD文件作为语义约束。

2、XSD文件的根元素

  XSD文件的根元素是<schema/>,它还可以有自己的属性,我们先看看spring-beans-3.2.xsd这个例子:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!--xsd文件本身是xml文件,第一行是xml声明-->
<xsd:schema xmlns="http://www.springframework.org/schema/beans" xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.springframework.org/schema/beans">
<!--
xsd作为xml文件,其根元素是schema
属性xmlns:xsd="http://www.w3.org/2001/XMLSchema"是引入文档约束的,表示在当前文档导入"http://www.w3.org/2001/XMLSchema"中所描述的规则,并且使用里面的元素要添加xsd的前缀(和xmlns:xsd相对应,也可以指定其它前缀)
属性targetNamespace="http://www.springframework.org/schema/beans"表示当前文档定义的规则处于命名空间"http://www.springfarmework.org/schema/beans"下面,xml文档如需要导入当前文档的规则,就可以指定这个命名空间
属性xmlns="http://www.springframework.org/schema/beans"表示在当前文档中导入"http://www.springframework.org/schema/beans"命名空间下所描述的规则(即当前文档本身描述的规则),并且无需使用前缀,也即默认命名空间,这样,在当前文档就可以直接引用所定义的元素了
-->
</xsd:schema>

我不知道第一次看见这个解释的人有没有迷糊,反正我第一次从w3c的教材上看到的时候是迷糊了,不过没关系,我们的目的主要是应用,以后写xsd文件的时候仿照spring就可以了。

  根元素schema的属性列表如下(先混个眼熟):

属性 说明 取值
id 标识该元素的唯一ID  
attributeFormDefault 指定XML文档使用schema中定义的局部属性时是否必须使用命名空间限定

qualified:必须通过命名空间前缀限定

unqualified:(默认值)无须通过命名空间前缀限定

elementFormDefault 指定XML文档使用schema中定义的局部元素时是否必须使用命名空间限定 取值和含义同attributeFormDefault
blockDefault

设定schema中element和complexType上的block属性的默认值

block属性用来阻止以指定的派生类型代替原类型

#all或者extension、restriction和substitution的*组合

例如extension表示防止通过扩展派生的复杂类型替代该复杂类型

finalDefault

设定schema中element、simpleType和complexType上的final的默认值

final属性用来阻止以指定的派生类型来派生新类型

对于element和complexType:值可以是#all或extension和restriction的*组合

对于simpleType:值可以是#all或restriction、list和union的*组合

targetNamespace 设定schema的命名空间的URI引用  
version 设定schema的版本  
xmlns 设定schema使用的一个或多个命名空间的URI引用  
any attributes 设定带有non-schema命名空间的任何其他属性  

3、在xml文档中使用xsd文件

  根据被引用的xsd文件是否定义了targetNamespace属性,可以分两种情况导入相应的xsd文件:

(1)引入无命名空间的XSD

<root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="无命名空间XSD文件的URI">
<!--
1.第一步,添加xmlns:xsi属性,引入xsi命名空间
2.第二步,通过xsi命名空间下的属性noNamespaceSchemaLocation指定XSD文件的URI
-->
</root>

(2)引入有命名空间的XSD

<root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ns1="前缀ns1对应命名空间" xmlns:ns2="前缀ns2对应命名空间" xsi:schemaLocation="ns1前缀对应命名空间 前缀ns1对应命名空间XSD文件的URI ns2前缀对应命名空间 前缀ns2对应命名空间XSD文件的URI">
<!--
1.第一步,添加xmlns:xsi属性,引入xsi命名空间
2.第二步,添加命名空间,可添加多个,但没有前缀的命名空间最多只能有1个
3.第三步,通过xsi命名空间下的属性schemaLocation指定每个命名空间XSD文件的URI,命名空间和相应URI一一对应,多个命名空间用空格分隔
-->
</root>

这里提醒一下:XSD文件引入的是w3的XMLSchema,而一般的XML文档引入的是XMLSchema-instance。

4、XSD文件的注释

  作为XML文件,XSD文件自然也可以使用<!-- -->的注释格式,除此之外,XSD文件中还可以使用XML元素的方式来注释,这就是<annotation>元素,<annotation>元素则是通过使用<document>和<appinfo>两个子元素来起作用的,其中<document>主要放适合人类阅读的注释,而<appinfo>则主要放置针对其它应用程序的注释信息。Spring的XSD文件中有大量的使用

<annotation>
<document><![CDATA[
说明文字
]]></document>
</annotation>

格式的注释,这里就不举例了。

5、在XSD文件中导入其它的XSD文件

在XSD文件中,如果你觉得有必要,还可以导入其它的XSD文件,这有点OO中模块化的意思,将相关的定义封装在一个XSD文件里,然后通过导入在其它XSD文件中使用。导入的方式有三种,列个表比较一下:

导入方式 前提条件 属性
include 被导入XSD文件要么没有命名空间,要么命名空间和当前文件相同,导入后相当于在同一个文件中定义 id:指定<include>元素本身的唯一标识;schemaLocation:指定被导入XSD文件的URI
redefine 前提和include相同,不同的是redefine可以接受<simpleType>或<complexType>从而重定义被导入XSD中内容 同include元素的属性相同
import 被导入XSD文件要么没有命名空间,要么命名空间和当前文件不同,因此import导入的XSD文件会保留原来的命名空间 除id和schemaLocation外,还有一个namespace属性用于指定被导入XSD文件的命名空间

说明一下,类似于C语言中的#include,导入XSD文件的元素只能作为根元素<schema>的子元素,并且位于除了注释元素<annotation>外所有元素的前面,至于三种导入方式的顺序则没有要求。

6、XSD元素

在XSD中,最强大的在于提供了数据类型的支持,并且可以自定义数据类型,在这篇笔记中我并不想就此进入XSD数据类型的泥潭,依旧先在外面转悠转悠,对XSD文件中的元素混个眼熟,这些元素相当于编程语言中的关键字,XSD就是用这些元素定义XML结构的,也可以直接访问W3C在线教程的相关部分:XML Schema参考手册

元素 解释
all 规定子元素能够以任意顺序出现,每个子元素可出现零次或一次。
annotation annotation 元素是一个顶层元素,规定 schema 的注释。
any 使创作者可以通过未被 schema 规定的元素来扩展 XML 文档。
anyAttribute 使创作者可以通过未被 schema 规定的属性来扩展 XML 文档。
appInfo 规定 annotation 元素中应用程序要使用的信息。
attribute 定义一个属性。
attributeGroup 定义在复杂类型定义中使用的属性组。
choice 仅允许在 <choice> 声明中包含一个元素出现在包含元素中。
complexContent 定义对复杂类型(包含混合内容或仅包含元素)的扩展或限制。
complexType 定义复杂类型。
documentation 定义 schema 中的文本注释。
element 定义元素。
extension 扩展已有的 simpleType 或 complexType 元素。
field 规定 XPath 表达式,该表达式规定用于定义标识约束的值。
group 定义在复杂类型定义中使用的元素组。
import 向一个文档添加带有不同目标命名空间的多个 schema。
include 向一个文档添加带有相同目标命名空间的多个 schema。
key 指定属性或元素值(或一组值)必须是指定范围内的键。
keyref 规定属性或元素值(或一组值)对应指定的 key 或 unique 元素的值。
list 把简单类型定义为指定数据类型的值的一个列表。
notation 描述 XML 文档中非 XML 数据的格式。
redefine 重新定义从外部架构文件中获取的简单和复杂类型、组和属性组。
restriction 定义对 simpleType、simpleContent 或 complexContent 的约束。
schema 定义 schema 的根元素。
selector 指定 XPath 表达式,该表达式为标识约束选择一组元素。
sequence 要求子元素必须按顺序出现。每个子元素可出现 0 到任意次数。
simpleContent 包含对 complexType 元素的扩展或限制且不包含任何元素。
simpleType 定义一个简单类型,规定约束以及关于属性或仅含文本的元素的值的信息。
union 定义多个 simpleType 定义的集合。
unique 指定属性或元素值(或者属性或元素值的组合)在指定范围内必须是唯一的。