XHTML规则
XHTML是XML得一个应用,它遵守XML得规范和要求。从技术角度上讲。这些语法规则是由XML规范定义的。
XML文档必须遵守的规则使得生成工具以解析文档变得更容易。这些规则也使得XML更容易处理。规则很简单,并且使用过HTML得人对于其中得一些规则应该比较熟悉。我们把XML得规则定义为下列两类:
∷XML语法规则,指的是定义了基本语法要求的规则。
∷XML文档规则,指的是管理着基本文档要求的规则。
∷XHTML语法规则
XHTML需要遵守的许多语法规则,比HTML文档需要遵守的规则严格很多。因此,下面所说的每个规则示例都伴随有使用HTML语法的HTML示例和遵循每节中定义的规则的XHTML示例。
1.所有的标记都必须要有一个相应的结束标记
以前在HTML中,你可以打开许多标签,例如<p>和<li>而不一定写对应的</p>和</li>来关闭它们。但在XHTML中这是不合法的。XHTML要求有严谨的结构,所有标签必须关闭。如果是单独不成对的标签,在标签最后加一个"/"来关闭它。例如:
<br /><img height="80" alt="网页设计师" src="../images/logo_w3cn_200x80.gif" width="200" />
2.所有标签的元素和属性的名字都必须使用小写
与HTML不一样,XHTML对大小写是敏感的,<title>和<TITLE>是不同的标签。XHTML要求所有的标签和属性的名字都必须使用小写。例如:<BODY>必须写成<body> 。大小写夹杂也是不被认可的,通常dreamweaver自动生成的属性名字"onMouseOver"也必须修改成"onmouseover"。
3.所有的XHTML标记都必须合理嵌套
同样因为XHTML要求有严谨的结构,因此所有的嵌套都必须按顺序,以前我们这样写的代码:
<p><b></p>/b>必须修改为:<p><b></b>/p>
就是说,一层一层的嵌套必须是严格对称。
4.所有的属性必须用引号""括起来
在HTML中,你可以不需要给属性值加引号,但是在XHTML中,它们必须被加引号。例如:
<height=80> 必须修改为:<height="80">
特殊情况,你需要在属性值里使用双引号,你可以用",单引号可以使用',例如:
<alt="say'hello'">
5.把所有<和&特殊符号用编码表示
任何小于号(<),不是标签的一部分,都必须被编码为< ;
任何大于号(>),不是标签的一部分,都必须被编码为> ;
任何与号(&),不是实体的一部分的,都必须被编码为&
6.给所有属性赋一个值
XHTML规定所有属性都必须有一个值,没有值的就重复本身。例如:
<td nowrap>
<input type="checkbox" name="shirt" value="medium" checked>
必须修改为:
<td nowrap="nowrap">
<input type="checkbox" name="shirt" value="medium" checked="checked">
7.不要在注释内容中使“- -”
“--”只能发生在XHTML注释的开头和结束,也就是说,在内容中它们不再有效。例如下面的代码是无效的:
<!--这里是注释-----------这里是注释-->
用等号或者空格替换内部的虚线。
<!--这里是注释= = = = = = = = = = = =这里是注释-->
以上这些规范有的看上去比较奇怪,但这一切都是为了使我们的代码有一个统一、唯一的标准,便于以识别。
∷XHTML文档规则
这里有为数不多的文档规则控制着良好构成的XML文档。我们还定义了一些可选择规则并推荐大家遵守,但这不是必须的。
把HTML转换成XHTML
1.手工转换文档
如果你更新数量不太多的文档,并且自己又很不愿意有一些XHTML实践经验,那么你会选择手工把HTML页面转换成XHTML。现在有非常出色的免费工具(HTML Tidy,将在下面具体讨论)可以帮你完成。但是,理解工具做了什么很重要,这样才能使用其中的自定义选项。
向后兼容性
XHTML与老式浏览器保持向后兼容。你应该记住XHTML使用HTML的词汇表,只有语法管理是阻止XHTML与老式浏览器兼容的实际障碍。幸运的是,XML语法与SGML(因此还有HTML)非常接近,因此语法方面的差别并不大。
在上面,已经讲解了XHTML文档必须遵守的所有规范,其中大多数已经由HTML进行了定义。额外的一些情况如所有的元素都必须关闭以及遵守空元素规则,是新增的
。
● 在使用XML的空元素语法时,在后面的斜线(/)之前要加一个空格,如<br />。
● 大多数老式浏览器会把XML的声明
<?xml version=”1.o” encoding=”HTF-8” standlone=”no”?>
作为内容显示出来,因此最好是省去将被老式浏览器看到的XHTML文档。如果你从文档中省去了XML声明,则该文档只能使用UTF-8或者UTF-16字符编码。
● 使用外部样式或者脚本文档,而不要把他们嵌入到你的XHTML文档的头部。在XHML代码之前,Web开发者可以使用HTML注释把脚本和样式单语句隐藏起来不被老式浏览器所见。XHTML使用XML CDATA节来标识内部脚本和样式单语法。
老式和新式的处理器很可能有冲突。如果你不使用外部脚本或者样式单,则应保证内部语句不要包含<.&.}]>或者--。
● 要在属性值或中加入折行或者多个空白符。许多XML开发者使用折行来帮助提供文档的可读性,但是浏览器对空白的处理切并不统一,并且在显示XHTML文档时多个空白符可能会引起问题。如果要使用空白符来提高可读性,那么要保证你只在元素之间使用这些空白符。
● 引用以英镑符(#value)开始的段识别符时要使用name和id属性。Name属性最初用于引用命名的锚接点(anchor);但是HTML4已经不在赞成使用此属性,并且引入了id属性代替它来唯一的标识给定的元素。为了保证将来的兼容性,你希望使用id属性;但是,因为许多目前的浏览器以及老式浏览器并不支持此属性,所以你也要使用name属性。例如:
<a name=”one” id=”one”>…</a>
● 同样,为了保持向前和向后的兼容性,还要同时使用lang和xml:lang属性来定义一个给定元素的语言。xml:lang属性比lang属性优先。
规则
作为XML的一个应用,XHTML要求遵守XML的语法要求。详细规则在前面已经说过。
闭合所有元素;
使用正确的空元素语法;
所有的属性值都必须用引号;
为所有属性分配值;
元素和属性名要小写。XHTML区分大小写;
元素要正确嵌套;
包含一个DOCTYPE声明
如果你坚持使用XHTML1的DTD之一,就不能使用HTML4的DTD引用。当你把自己的文档从HTML转换到XHTML时,要保证使用的是正确的DOCTYPE声明。
XHTML提供了三种dtd声明可供选择:
过渡的(transitional):
要求非常宽松的dtd,它允许你继续使用html4.01的标识(但是要符合xhtml的写法)。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
严格的(strict):
要求严格的dtd,你不能使用任何表现层的标识和属性,例如<br>。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 STRICT//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict.dtd">
框架的(frameset):
专门针对框架页面设计使用的dtd,如果你的页面中包含有框架,需要采用这种dtd。完整代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 FRAMESET//EN" http://www.w3.org/tr/xhtml1/dtd/xhtml1-frameset.dtd">
添加XHTML名字空间:
XHTML使用XML名字空间来帮助唯一地标识元素和属性集。这种办法对于计划混和(嵌套)使用其他XML词汇表地时候尤其会带来方便。根据XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML技术规范,所有的XHTML文档都必须使用默认的XHTML名字空间(xmlns="http://www.w3.org/1999/xhtml")。这个名字空间是要求使用的,并且必须定义在html起始标志中。
综合应用
下面的清单不是一个良好构成的XHTML文档,我们将把它转换成良好构成的XHTML文档。
不严谨的HTML文档
<HTML>
<HEAD>
<TITLE>Sloppy HTML</TITLE>
</HEAD>
<BODY>
<H1>Element Rules</H1>
<P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT>
<BR>
<OL COMPACT>
<LI>Close all elements.
<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.
<LI>Convert all stand-alone attributes to attributes with values.
<LI>Add quotation marks to all attribute values.
<LI>Convert all uppercase element and cttribute names to lowercase.
<LI>Use the appropriate DOCTYPE declaration.
<LI>Add the XHTML namespace to the html start tag.
<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "
</OL>
</BODY>
</HTML>
按照下列步骤把上述文档更改为具有良好的构成:
1.关闭所有元素。注意p元素以及列表项元素(li)都没有关闭标志,因此应该添加标识关闭的p和li标志。
<P><FONT COLOR=RED>Elements provide the structure that holds your document together.</FONT></P>
<BR>
<OL COMPACT>
<LI>Close all elements.</LI>
<LI>Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility. </LI>
<LI>Convert all stand-alone attributes to attributes with values. </LI>
<LI>Add quotation marks to all attribute values. </LI>
<LI>Convert all uppercase element and cttribute names to lowercase. </LI>
<LI>Use the appropriate DOCTYPE declaration. </LI>
<LI>Add the XHTML namespace to the html start tag. </LI>
<LI>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility. "</LI>
</OL>
2.空元素应该最手空元素语法,并且要保证加入必要的空格以保持向后兼容性。BR元素是上述文档中唯一的空元素,因此应该把它更改成<BR />。
3.把所有独立的属性转换成带有值的属性。把COMPACT更改为COMPACT=COMPACT。
4.在所有属性值上加引号。
<P><FONT COLOR="RED">Elements provide the structure that holds your document together.</FONT></P>
<BR>
<OL COMPACT="COMPACT">
5.把所有大写元素和属性名(以及属性值)都转换为小写。
<html>
<head>
<title>Sloppy HTML</title>
</head>
<body>
<h1> Element Rules</h1>
<p><font color="red"> Elements provide the structure that holds your document together.</font></p>
<br />
<ol compact="compact">
<li> Close all elements.</li>
<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>
<li> Convert all stand-alone attributes to attributes with values.</li>……
6.使用正确的DOCTYPE声明。我们将使用过渡型(Transitional)DTD:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
7.把XHTML名字空间添加到html起始标志中。
<html xmlns=http://www.w3.org/1999/xhtml>
最后得到的代码如下:
简洁的XHTML文档
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/tr/xhtml1/dtd/xhtml1-transitional.dtd">
<html xmlns=http://www.w3.org/1999/xhtml>
<head>
<title>Sloppy HTML</title>
</head>
<body>
<h1> Element Rules</h1>
<p><font color="red"> Elements provide the structure that holds your document together.</font></p>
<br />
<ol compact="compact">
<li> Close all elements.</li>
<li> Empty elements should follow empty-element syntax,and besure to add the white space for backward compatibility.</li>
<li> Convert all stand-alone attributes to attributes with
values.</li>
<li> Add quotation marks to all attribute values.</li>
<li>Convert all uppercase element and cttribute names to lowercase.</li>
<li>Use the appropriate DOCTYPE declaration.</li>
<li>Add the XHTML namespace to the html start tag.</li>
<li>Make sure you comply with any backward-compatible steps defined in the section "Backward Compatibility."</li>
<ol>
</body>
</html>