超文本标记语言HTML

时间:2022-11-19 20:52:07

 

超文本标记语言,即HTML(Hypertext Markup Language),是用于描述网页文档的一种标记语言。

 

  在WWW上的一个超媒体文档称之为一个页面(page)。作为一个组织或个人在万维网上放置开始点的页面称为主页Homepage,或首页,主页中通常包括有指向其他相关页面或其他节点的指针(超级链接)。在逻辑上将视为一个整体的一系列页面的有机集合称为网站(Website或Site)。  HTML是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全的解释,因而可能会有不同的显示效果。  HTML之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。所谓超级链接,就是一种URL指针,通过激活(点击)它,可使浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要的原因之一。  网页的本质就是HTML,通过结合使用其他的Web技术(如:脚本语言、CGI、组件等),可以创造出功能强大的网页。因而,HTML是Web编程的基础,也就是说万维网是建立在超文本基础之上的。
标准的版本历史

HTML

  超文本标记语言(第一版)——在1993年6月作为互联网工程工作小组(IETF)工作草案发布(并非标准):  HTML 2.0——1995年11月作为RFC 1866发布,在RFC 2854于2000年6月发布之后被宣布已经过时  HTML 3.2——1996年1月14日,W3C推荐标准  HTML 4.0——1997年12月18日,W3C推荐标准  HTML 4.01(微小改进)——1999年12月24日,W3C推荐标准  ISO/IEC 15445:2000(“ISO HTML”)——2000年5月15日发布,基于严格的HTML 4.01语法,是国际标准化组织和国际电工委员会的标准。  HTML没有1.0版本是因为当时有很多不同的版本。有些人认为蒂姆·伯纳斯-李的版本应该算初版,这个版本没有IMG元素。当时被称为HTML+的后续版的开发工作于1993年开始,最初是被设计成为“HTML的一个超集”。第一个正式规范为了和当时的各种HTML标准区分开来,使用了2.0作为其版本号。HTML+的发展继续下去,但是它从未成为标准。  HTML3.0规范是由当时刚成立的W3C于1995年3月提出,提供了很多新的特性,例如表格、文字绕排和复杂数学元素的显示。虽然它是被设计用来兼容2.0版本的,但是实现这个标准的工作在当时过于复杂,在草案于1995年9月过期时,标准开发也因为缺乏浏览器支持而中止了。3.1版从未被正式提出,而下一个被提出的版本是开发代号为Wilbur的HTML 3.2,去掉了大部分3.0中的新特性,但是加入了很多特定浏览器,例如Netscape和Mosaic的元素和属性。HTML对数学公式的支持最后成为另外一个标准MathML。  HTML 4.0同样也加入了很多特定浏览器的元素和属性,但是同时也开始“清理”这个标准,把一些元素和属性标记为过时的,建议不再使用它们。HTML的未来和CSS结合会更好。  HTML 5目前仍为草案,并已被W3C接纳。

XHTML

  XHTML 1.0——发布于2000年1月26日,是W3C推荐标准,后来经过修订于2002年8月1日重新发布。  XHTML 1.1,于2001年5月31日发布,W3C推荐标准。  XHTML 2.0,W3C工作草案。  XHTML 5,从XHTML 1.x的更新版,基于HTML 5草案。

HTML的特点

  HTML文档制作不是很复杂,且功能强大,支持不同数据格式的文件镶入,这也是WWW盛行的原因之一,其主要特点如下:  1 简易性,HTML版本升级采用超集方式,从而更加灵活方便。  2 可扩展性,HTML语言的广泛应用带来了加强功能,增加标识符等要求,HTML采取子类元素的方式,为系统扩展带来保证。  3 平台无关性。虽然PC机大行其道,但使用MAC等其他机器的大有人在,HTML可以使用在广泛的平台上,这也是WWW盛行的另一个原因。  编辑HTML  HTML其实是文本,它需要浏览器的解释,HTML的编辑器大体可以分为三种,  1 基本编辑软件,使用WINDOWS自带的记事本或写字版都可以编写,当然,如果你用WPS来编写,也可以。不过存盘时请使用.htm或.html作为扩展名,这样浏览器就可以解释执行了。  2 半所见即所得软件,这种软件能大大提高开发效率,它可以使你在很短的时间内做出HOMEPAGE,且可以学习HTML,这种类型的软件主要有HOTDOG,还有国产的软件网页作坊  3 所见即所得软件,使用最广泛的编辑器,完全可以一点不懂HTML的知识就可以做出网页,这类软件主要有FRONTPAGE2003,DREAMWEAVER

HTML文件的整体结构

  一个网页对应于一个HTML文件,HTML文件以.htm或.html为扩展名。可以使用任何能够生成TXT类型源文件的文本编辑来产生HTML文件。标准的HTML文件都具有一个基本的整体结构,即HTML文件的开头与结尾标志和HTML的头部与实体2大部分。有3个双标记符用于页面整体结构的确认。  标记符<HTML>说明该文件是用HTML来描述的。它是文件的开头,而</HTML>则表示该文件的结尾,它们是HTML文件的始标记和尾标记。  <head></head>这2个标记符分别表示头部信息的开始和结尾。头部中包含的标记是页面的标题、序言、说明等内容,它本身不作为内容来显示,但影响网页显示的效果。头部中最常用的标记符是标题标记符和meta标记符,其中标题标记符用于定义网页的标题,它的内容显示关于HTML(4张)在网页窗口的标题栏中,网页标题可被浏览器用作书签和收藏清单。

文件主体内容

  <body></body>,网页中显示的实际内容均包含在这2个正文标记符之间。正文标记符又称为实体标记。

HTML文档标题

页面主体内容描述

  <html> 标记网页的开始  <head>标记头部的开始:头部元素描述,如文档标题等,还可以加入css与javascript的引入标签<script />与<link />  </head>标记头部的结束  <body> 标记页面正文开始  页面实体部分  </body>标记正文结束  </html>标记该网页的结束  当然,如果不使用以上基本框架结构,而直接使用在实体部分中出现的标记符,在浏览器下也可以解释执行。

正文标记的使用

  每种HTML标记符在使用中可带有不同的属性项,用于描述该标记符说明的内容显示不同的效果。正文标记符中提供以下属性来改变文本的颜色及页面背景。  BGCOLOR 用于定义网页的背景色,BACKGROUND用于定义网页背景图案的图像文件  TEXT 用于定义正文字符的颜色,默认为黑色  LINK用于定义网页中超级链接字符的颜色,默认为蓝色  VLINK 用于定义网页中已被访问过的超接链接字符的颜色,默认为紫红色  ALINK 用于定义被鼠标选中,但未使用时超链字符的颜色,默认为红色  例如:标记将定义页面的背景色为黑色,正文字体显示为白色。  以上属性使用中,需要对颜色进行说明,在HTML中对颜色可使用2种方法说明颜色属性值,即颜色名称(英文名)和颜色值。其中颜色值用6个十六进制数来分别描述红、绿、蓝三原色的配方法——称为RGB值,每2个十六进制数表示一种颜色。使用颜色值时,应在值前冠以“#”号。  使用图案代替背景颜色,可以使页面更生动、美观。  可将图像文件image.gif所表示的一幅图像作为页面的背景,若图像幅面不够大,将会将图像重复平铺在窗口中。

HTML字符集

  在网页中除了可显示常见的ASCII字符和汉字外,HTML还有许多特殊字符,它们一起构成了HTML字符集。有2种情况需要使用特殊字符,一是网页中有其特殊意义的字符,二是键盘上没有的字符。HTML字符可以用一些代码来表示,代码可以有2种表示方式。即字符代码(命名实体)和数字代码(编号实体)。字符代码以&符开始,以分号结束,其间是字符名;数字代码也以&符开始,以分号结束,其间是#号加编号。

HTML的有关约定

  在编辑HTML文件和使用有关标记符时有一些约定或默认的要求。  (1) 文本标记语言源程序的文件扩展名默认使用htm或html。在使用文本编辑器时,注意修改扩展名。而常用的图像文件的扩展名为gif和jpg。  (2) HTML源程序为文本文件,其列宽可不受限制,即多个标记可写成一行,甚至整个文件可写成一行;若写成多行,浏览器一般忽略文件中的回车符(标记指定除外);对文件中的空格通常也不按源程序中的效果显示。完整的空格可使用特殊符号(实体符)“&nbsp(注意此字母必须小写,方可空格)”表示非换行空格;表示文件路径时使用符号“/”分隔,文件名及路径描述可用双引号也可不用引号括起。  (3) 标记符中的标记元素用尖括号括起来,带斜杠的元素表示该标记说明结束;大多数标记符必须成对使用,以表示作用的起始和结束;标记元素忽略大小写,即其作用相同,但完整的空格可使用特殊符号“&nbsp(注意此字母必须小写,方可空格)”;许多标记元素具有属性说明,可用参数对元素作进一步的限定,多个参数或属性项说明次序不限,其间用空格分隔即可;一个标记元素的内容可以写成多行。  (4) 标记符号,包括尖括号、标记元素、属性项等必须使用半角的西文字符,而不能使用全角字符  (5) HTML注释由惊叹号表示,注释内容由符号结束。注释内容可插入文本中任何位置。任何标记若在其最前插入惊叹号,即被标识为注释,不予显示。
  转自http://baike.baidu.com/view/177797.htm