xml元素类型PCDATA和CDATA的区别(DTD中)

时间:2022-06-28 16:30:11

PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 &amp; &lt; &gt; 实体来分别替换它们。


CDATA
CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
几个实体引用字符
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '


又有网上有人这样说,我觉得挺直观,先转过来:
PCDATA表示已解析的字符数据。
CDATA不通过解析器进行解析的文本,文本中的标签不被看作标记。CDATA表示里面是什么数据XML不会解析,比如

  
  
  1. <![CDATA[ 
  2. if(a>b){ 
  3. System.out.println(a); 
  4. } 
  5. ]]> 


注意上面的a与b之间的 > 符号.

PCDATA的数据是要给xml解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义。上面的数据如果用PCDATA表示应该如下:

  
  
  1. if(a&gt;b){  
  2. System.out.println(a);  
  3. }


CDATA是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如js代码等。CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:

  
  
  1. <script>  
  2. <![CDATA[  
  3. function matchwo(a,b){  
  4. if (a < b && a < 0){  
  5. return 1;  
  6.  
  7. else{  
  8. return 0;  
  9.  
  10.  
  11. ]]>  
  12. </script>  

#PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的

  
  
  1. <?xml version="1.0"?> 
  2. <!DOCTYPE note [ 
  3.   <!ELEMENT note (to,from,heading,body)> 
  4.   <!ELEMENT to      (#PCDATA)> 
  5.   <!ELEMENT from    (#PCDATA)> 
  6.   <!ELEMENT heading (#PCDATA)> 
  7.   <!ELEMENT body    (#PCDATA)> 
  8. ]> 
  9. <note> 
  10.   <to>George</to> 
  11.   <from>John</from> 
  12.   <heading>Reminder</heading> 
  13.   <body>Don't forget the meeting!</body> 
  14. </note> 


关于实体引用,转载了一篇文章解释的比较好:
通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。在下列情况下,这样做很有用:
因为会被解释为标记,字符无法直接输入文档。
因为输入设备的限制,字符无法直接输入文档。
字符无法通过限于单字节字符的处理器可靠地传输。字符串或文档片断反复出现,并且可以缩写。为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。代码点可以使用十进制或十六进制表示法标识。
用于十进制引用的语法:    &#value;
用于十六进制引用的语法:  &#xvalue;

例如,要插入欧元符号,许多键盘上仍没有该字符,可以将 &#x20AC; 或 &#8364; 插入文档。
下表为 XML 标记使用的字符列出了五种内置实体。实体 实体引用 含义

实体 实体引用 含义
lt &lt; <(小于号)
gt &gt; >(大于号)
amp &amp; &(“and”符)
apos &apos; '(撇号或单引号)
quot &quot; "(双引号)


如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos; 和 &quot; 实体引用最常用在属性值中。

 

例一: 双引号的使用。

 

双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

 a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

<add key="IPhone" value="apple"/>  ...属性值为 ("apple").

解决:  <add key="IPhone" value=’"apple"‘/>

 b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

< add key = " IPhone " value = "&quot;&apos;apple&quot;" />