在2.1.2节中通过新老DOCTYPE的对比,读者可以清晰地看到HTML 5在精简旧有结构上做出的努力。DOCTYPE在出现之初主要用于XML中,用作描述XML允许使用的元素、属性和排列方式。起初HTML借鉴了XML中DOCTYPE的使用方法,并赋予了新用法,如大家熟知的触发浏览器的标准模式。假使在制作一张页面时,没有设定DOCTYPE,则浏览器会以怪异模式状态进行处理(即Quirks模式),该模式与标准模式在盒模型、样式、布局等都存在较大差异。因此,DOCTYPE在制作页面时是不可或缺的部分。
在上一版本HTML 4标准中,DOCTYPE被分为3种模式:
- 严格模式,即严格遵循W3C标准的模式,代码格式如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
- 过渡模式,包含了W3C标准的内容,同时还可以使用不被W3C推荐的标签,如font、b等,而且不可以使用框架元素(即frameset元素),代码格式如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">
- 框架模式,可以使用框架元素,其他与过渡模式相同,代码格式如下:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
提示:旧有的HTML关于DOCTYPE标准,读者可以参看W3C官方文档说明,网页地址:http://www.w3.org/TR/1999/REC-html401-19991224/struct/global.html#h-7.2。虽然之前版本的HTML对DOCTYPE做了重重规定,但真实情况却是浏览器会尽最大的可能渲染对应的页面,即使可能出现了一些不符合模式的做法,唯一会出现的是浏览器会在控制台中显示一些错误警告,这种做法就是常说的浏览器容错性,实则是对市场和用户的妥协。
故事发展到HTML 5,W3C将DOCTYPE剔除原有鸡肋的声明方式,简化为如下格式:
<!DOCTYPE html>
对于绝大多数开发者来说,只需要使用这一种方式就足以满足日常的开发使用,但如果要考虑到日后的兼容和扩展等一系列问题,还需要了解W3C在新制定DOCTYPE的一些新规定,主要分为3类:
- 普通模式,即<!DOCTYPE html>
- 弃用模式,听起来不知所云,其实指的就是对过往模式的兼容模式,不过HTML5弃用了之前的过渡模式和框架模式,最终留下了6种书写格式,代码如下:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.0//EN">
- <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.0//EN" "http://www.w3.org/TR/REC-html40/strict.dtd">
- <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.01//EN">
- <!DOCTYPE html PUBLIC "-//W3C//DTD HTML4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML1.0 Strict//EN"
- "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
- <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
- 遗留兼容模式,对于过往无法考证规则的一种兼容方式,语法格式如下:
- <!doctype HTML system"about:legacy-compat">
通过对浏览器DOCTYPE的理解,读者可以熟悉浏览器模式的触发方式,不过就通常开发而言,只需要使用<!DOCTYPEhtml>这一种普通模式。
提示:HTML 5最新3种模式可以查看链接http://dev.w3.org/html5/markup/syntax.html#doctype-syntax。
所谓的字符是对各种文字和符号的总称,涵盖了各国文字、标点符号、图形符号和数字等。字符集是对多个字符的集合,常用的字符集有:ASCII、GB2312、Unicode、ISO等。科学家为了让计算机准确地处理各种字符集,需要对字符进行编码,以便计算机能够识别和存储各种文字。
在HTML 5出现之前,浏览器会根据3种方式确认页面的编码格式,按优先级排列如下:
- 获取HTTP请求头中的Content-Type字符对应的值。
- 使用meta标签声明,语法格式如下:
<meta http-equiv="Content-Type"content="text/html; charset=utf-8">
- 外链资源使用charset属性声明编码格式,如script标签中使用语法格式如下:
<script type="text/javascript"src="myscripts.js" charset="UTF-8"></script>
HTML 5出现后,对字符集的使用做了大量的简化,可以使用以下语法进行字符集声明:
<meta charset="utf-8">
对于日常使用网站开发而言,结合HTML 5的字符集使用,笔者给出如下建议:
- 最优先使用HTTP请求头指定编码。
- 统一全站字符集编码,HTML 5推荐UTF-8字符集。
- 使用meta标签确认字符集编码,尽可能放在html标签的第一个子元素位置。
- 第三方引用的脚本,在不确认字符编码时,加上charset属性设置编码格式。
学习HTML5最好的书就是《HTML5网页开发实例详解》,用代码学习用案例学习,可比看文字有趣多了!!!一本书搞定HTML5,从现在开始。